后面的60%就等下次文字转WAV音频