所以他们两个拿到了文字转WAV音频