拍摄采取的是现场录音文字转WAV音频