只留下目标人物说话的语音信息矢量图片生成

只留下目标人物说话的语音信息