仅仅是避免不必要的冲突文字转WAV音频