就是用镜头语言去讲故事和说自己的话文字转WAV音频