这才是通过最后一幕的条件文字转WAV音频