所以他们必须亲自去迎接文字转WAV音频