从到场的客人穿着举止来看文字转WAV音频