只能依稀辨认出是两个人来文字转WAV音频