他还是能够区分出来的文字转WAV音频