并没有将融合后的状态展示给他们看文字转WAV音频