但是他提出了一个要求文字转WAV音频