人群的目光文字转WAV音频