以均衡的方式融合文字转WAV音频