根据监控拍到的画面文字转WAV音频