即使是他们两人也需要经过一系列的计算文字转WAV音频