他还是能从轮廓上分辨出文字转WAV音频