进行了第三次融合文字转WAV音频