所以他们两个人分工文字转WAV音频