双方的交流实际上是通过翻译完成的文字转WAV音频