因为我们几乎是自己选择放弃的文字转WAV音频