增加些照明设备和摄像头相对就简单了许多文字转WAV音频