是从客人嘴中得知文字转WAV音频