他们花了大量的时间进行商讨文字转WAV音频