绝大部分区域还是完好无损的文字转WAV音频