按照我们的计划捕捉全景镜头文字转WAV音频