其实他们想的还是太简单了点文字转WAV音频