所以他需要第一时间文字转WAV音频