他要确保自己基本上能够一次成功文字转WAV音频