于是双方言语不和文字转WAV音频