命令子体将收集到的画面全部传递过来文字转WAV音频