对方用的是人类形态文字转WAV音频