把几个通道的人声输入编组到辅助输出去矢量图片生成

把几个通道的人声输入编组到辅助输出去