但同时也变得更难控制文字转WAV音频