只是在回避极端文字转WAV音频