拥有了继续叠加的基础文字转WAV音频