包括每一个进出人的气息和所有信息文字转WAV音频