重则会出现意识模糊文字转WAV音频