通过摄像机镜头和电视机画面文字转WAV音频