但声音还是可以辨别出来的文字转WAV音频