所以自然可以分辨出文字转WAV音频