第二阶段就自动结束文字转WAV音频