而是一个完整的整体文字转WAV音频