的核心控制区域内文字转WAV音频