也就是说从一开始文字转WAV音频