最终还是只能放弃文字转WAV音频