但是还是需要走一下过场文字转WAV音频