既然双方都已经认识了文字转WAV音频