所以估计这次拍摄进度会比较赶文字转WAV音频