开始观察每个人脸上的反应文字转WAV音频