形成三个独立模块文字转WAV音频