他们的任务就是等待文字转WAV音频