他们现在就是等待文字转WAV音频