也要做一部分的存留文字转WAV音频