所以他总结了一点文字转WAV音频