还能够辨认得出来他们的身份文字转WAV音频