然后保留一定的核心文字转WAV音频