其实是双方的责任文字转WAV音频