双方又是一些简单的询问文字转WAV音频