他们会平衡一些文字转WAV音频