而当他提出第一个问题的时候文字转WAV音频