只能被动的进行着防守文字转WAV音频