我们应该达成一个初步协议文字转WAV音频