又怎么在最后关头主动认输文字转WAV音频