我们内部必须稳定文字转WAV音频