他们用摄像机拍一遍视频文字转WAV音频