这个会造成失衡文字转WAV音频