结果显而易见确实是误会了文字转WAV音频