可以靠自身的气息而认定主人文字转WAV音频