把整个界面尽可能的回归到最基本的状态文字转WAV音频