有两个甚至三个以上的团队……那么理论上说文字转WAV音频