所以他提出了这个建议文字转WAV音频