就是看双方是否文字转WAV音频