两人的话音要分辨一下文字转WAV音频