最终他还是选择了相信文字转WAV音频