分割之后再识别对象之间关系，新模型RAM为SAM赋予新技能

当前位置：首页 > 资讯 > >正文

分割之后再识别对象之间关系，新模型RAM为SAM赋予新技能

来源：机器之心时间：2023-05-03 18:51:19

机器之心专栏

机器之心编辑部

本月初，Meta 推出的「分割一切（Segment Anything Model，SAM）」模型引起了广泛的关注。最近，来自南洋理工大学 MMLab团队、伦敦国王学院和同济大学VisCom 实验室的研究者们联合推出了一款名为「Relate-Anything-Model（RAM）」的新模型。RAM 模型赋予了 Segment Anything Model（SAM）识别不同视觉概念之间的各种视觉关系的能力。该模型由同学利用闲暇时间合作开发。

演示程序链接：https://huggingface.co/spaces/mmlab-ntu/relate-anything-model

【资料图】

代码链接：https://github.com/Luodian/RelateAnything

数据集链接：https://github.com/Jingkang50/OpenPSG

RAM 模型基于 ECCV"22 SenseHuman Workshop & 国际算法算例大赛 “Panoptic Scene Graph Generation” 赛道冠军方案GRNet。首先，我们来了解一下PSG baseline的基本信息和GRNet 的工作原理。

PSG baseline

PSG挑战赛奖金百万，共收到来自全球 100 支团队提交的各种解决方案，其中包括先进的图像分割方法、解决长尾问题等等。该竞赛还收到了一些创新性的方法，如场景图专用的数据增强技术。经过评估，考虑性能指标、解决方案的新颖性和意义等，小红书团队的 GRNet脱颖而出，成为获胜方案。

比赛详情请参考：https://github.com/Jingkang50/OpenPSG

在介绍 PSG 挑战赛的获胜方案之前，我们首先介绍两个经典的 PSG 基线方法，其中一个是双阶段方法，另一个是单阶段方法。如下图(a)所示，双阶段基线方法在第一阶段使用预训练的全景分割模型 Panoptic FPN 从图像中提取特征、分割和分类预测。然后，将每个个体对象的特征提供给经典的场景图生成器（例如 IMP），以便在第二阶段进行适应 PSG 任务的场景图生成。该双阶段方法让经典的 SGG 方法以最少的修改适应 PSG 任务。

如上图(b)所示，单阶段基线方法 PSGTR 首先使用 CNN 提取图像特征，然后使用类似 DETR 的 transformer 编码器 - 解码器来直接学习三元组表示。其中，匈牙利匹配器用于将预测的三元组与ground truth三元组进行比较，然后优化目标最大化匹配器计算的成本，并使用交叉熵进行分类损失，使用 DICE/F-1 计算分割的损失。

冠军方案模型架构

PSG 任务的获胜团队提出了一种名为 GRNet 的新方法。PSG 原文的研究已经表明：单阶段模型目前表现优于双阶段模型，因此获胜团队推测，这主要是因为来自图像特征图的直接监督信号有利于捕捉关系。然而，获胜团队还发现，单阶段模型通常无法达到良好的分割性能。

基于这一观察，获胜方案旨在在两个模式之间找到一个权衡，通过重视双阶段范式并赋予其类似于单阶段范式中获取全局上下文的能力来实现。具体来说，如下图所示，获胜团队首先采用 Mask2Former 等现成的全景分割方法生成每个对象的分割。然后将来自分割器的特定对象的中间特征映射与其对应的分割融合成对象级别特征。获胜团队提出了一种全局上下文模块，利用处理全局信息特征映射的 transformer 处理每个对象级别内容。

值得注意的是，该方案还添加了一个类别嵌入以指示对象的类别。通过 transformer 编码器中的交叉注意力机制，输出的对象特征从其他对象中收集了更多的全局信息。最后，该方案对每个对象级别特征执行全局平均池化，以进一步生成上下文丰富的新对象嵌入。对于每个关系类别，执行关系二元分类任务以确定对象对之间是否存在关系。

冠军方案关系分类

获胜团队对关系二元分类任务还有一些特别的考虑。例如，他们注意到 PSG 数据集通常包含两个具有多个关系的对象，例如 “人看着大象” 和 “人喂大象” 同时存在。为了解决这个问题，他们的解决方案是将关系预测从单标签分类问题转换为多标签分类问题。

此外，获胜团队还意识到，PSG 数据集通过要求注释者选择特定和准确的谓词（如 “停在” 而不是更一般的 “在”）来追求精度和相关性，可能不适合学习边界关系（如 “在” 实际上与 “停在” 同时存在）。为了解决这个问题，获胜团队提出了一种自我训练策略，使用自我蒸馏标签进行关系分类，并使用指数移动平均（EMA）来动态更新标签。

冠军方案的其他设计

在计算关系二元分类损失时，每个预测对象必须与其对应的ground truth对象配对。匈牙利匹配算法能完成这个任务，但该算法容易出现不稳定的情况，特别是在网络准确度低的早期训练阶段。这可能导致对于相同的输入，产生不同的匹配结果，导致网络优化方向不一致，使训练变得更加困难，这个问题通常被称为 “匹配抖动”。为了解决该问题，获胜团队采用了去噪训练，其中将嘈杂的真实结果以快捷方式输入到解码器中，以学习相对偏移量，跳过匹配步骤，允许直接学习方法，有效地克服了匹配抖动带来的挑战。

冠军方案获奖理由

PSG 挑战的获胜解决方案 GRNet 旨在重新使用双阶段范式并赋予其像单阶段范式一样获取全局上下文的能力，以实现双阶段和单阶段两种范式之间的平衡。GRNet 首先采用全景分割方法生成每个对象的分割。然后将来自分割器的特定对象的中间特征映射和其对应的分割融合成对象级别特征。获胜团队通过使用 transformer 处理每个对象级别内容并利用交叉注意力机制进一步丰富全局特征映射来构建全局上下文模块。最后，对每个对象级别特征执行全局平均池化以生成新的对象嵌入。对于每个关系类别，执行关系二元分类任务以确定对象对之间是否存在关系。

获胜团队解决了许多挑战，例如双阶段范式利用全局信息的方法、关系精度和概括性之间的冲突，以及轻量级双阶段范式的计算效率。最终，获胜方案在所有参与者中获得了最好的总体得分。

RAM 模型

RAM 模型大致的设计思路是：利用 Segment Anything Model（SAM）来识别和分割图像中的物体，并提取每个分割物体的特征。RAM 使用 Transformer 模块使分割物体之间产生交互作用，从而得到新的特征，计算它们的配对关系并分类它们的相互关系。相比于 GRNet，RAM 做了如下简易的修改：

1. 利用 Segment Anything Model（SAM）作为特征提取器，代替原方案的 mask2former。

2. 新 GT 匹配：由于 RAM 研究团队使用 PSG 数据集来训练模型，对于每个训练图像，SAM 会分割多个物体，但只有少数与 PSG 的 ground truth（GT）mask 相匹配。RAM研究团队根据它们的交集 - 并集（IOU）分数进行简单的匹配，以便（几乎）每个 GT mask 都被分配到一个 SAM mask 中。然后，该研究根据 SAM 的 mask 重新生成关系图，最后使用交叉熵损失来训练 RAM 模型。

RAM 方案整体流程如下图所示：

我们来看一些「Relate-Anything-Model（RAM）」的应用实例。如下图所示，RAM 模型实现的图像分析结果令人印象深刻。这些结果展示了 RAM 模型出色的性能和多样化应用的潜力。

感兴趣的读者可以访问RAM 模型的 Huggingface 演示页面和数据集，了解更多研究细节。研究团队表示希望 RAM 模型能够为使用者带来启发和创新，并期待获得反馈和建议。

©THE END

转载请联系本公众号获得授权

投稿或寻求报道：content@jiqizhixin.com

X 关闭

最近更新

分割之后再识别对象之间关系，新模型RAM为SAM赋予新技能

2023-05-03 18:51:19

资讯
意识的能动作用表现在哪些方面_意识的能动作用三个表现及方法论

2023-05-03 17:41:23

资讯
白凉粉自制果冻的危害_自制凉粉的简单做法

2023-05-03 16:53:05

资讯
上海一价值万元的宠物鸭在花园散步被人掳走，差点被做成“老鸭煲”

2023-05-03 15:54:15

资讯
时讯：国产剧又“封神”了？但事实证明，这部剧真的“赶英超美”了

2023-05-03 15:07:44

资讯
天天新消息丨网红客栈床下藏尸！被害人家属发声：她和凶手素味平生…

2023-05-03 14:17:45

资讯
ps光照效果是灰色的（ps光照效果怎么做）

2023-05-03 13:08:15

资讯
全球快看：庐山“匡庐雅集”引爆线上诗词变装挑战秀

2023-05-03 12:14:31

资讯
放松身心亲近自然自驾露营成旅游新风尚

2023-05-03 11:20:54

资讯
保定长城保护检察公益诉讼案入选最高检典型案例世界动态

2023-05-03 10:46:01

资讯
wps中excel如何启用宏_WPS Excel表格怎么启用宏功能-全球观天下

2023-05-03 09:53:51

资讯
天津地铁Z2线掀起劳动竞赛热潮世界通讯

2023-05-03 09:09:22

资讯
当前视讯！“五一”小长假游客热衷打卡艺术展

2023-05-03 07:57:31

资讯
环球观焦点：美债务上限问题迫在眉睫达成短期性解决方案的可能性上升

2023-05-03 05:00:26

资讯
践行劳模精神，山东能源肥矿集团劳动模范董峰立足岗位作表率

2023-05-03 02:03:36

资讯
通报表扬！厦门这些集体、个人上榜！

2023-05-02 23:09:13

资讯
封面报道｜被短视频“困”住的孩子

2023-05-02 21:44:53

资讯
若我国3万亿外汇遭美冻结该咋办？日媒：下个目标大概率是中国

2023-05-02 20:54:25

资讯
劳动者权益不容侵犯！这份维权“宝典”送给你

2023-05-02 19:56:47

资讯
苹果电脑怎么重启（苹果14怎么重启）

2023-05-02 18:44:20

资讯
新加坡将外国人房产印花税调高至60% 买房能降温吗？天天热文

2023-05-02 17:26:03

资讯
世界热推荐：南方医科大学南海医院皮肤科资质、医生口碑一键获取！

2023-05-02 16:24:27

资讯
明天(5月3～8号）大暴雨大雨来袭，连下6天，60年冷春？农谚咋说

2023-05-02 15:10:54

资讯
第二架搭载中国从苏丹撤离人员的临时航班从沙特启程归国

2023-05-02 13:59:09

资讯
论单挑，吕布只赢过一次，但为何他却能成为三国第一猛将！

2023-05-02 13:13:18

资讯
全球聚焦：“五一”假期兰州市多个公园日均游客量过万

2023-05-02 12:11:52

资讯
天天快资讯丨六年级上册科学知识点归纳人教版（教科版六年级(上册)科学知识点整理）

2023-05-02 11:09:14

资讯
“广场建起来，锻炼唠嗑有了好去处”（帮扶县驻村手记）

2023-05-02 10:17:18

资讯
瑞幸咖啡一季度营收44.37亿元新开门店1137家-全球速看料

2023-05-02 09:43:31

资讯
速看：5月2日生意社PP(纤维)基准价为7700.00元/吨

2023-05-02 09:03:52

资讯
挂机赚钱游戏每天50元_玩客云如何赚钱

2023-05-02 08:02:32

资讯
北京今天最高28℃，阵风六级左右，出游注意防风防晒

2023-05-02 06:54:45

资讯
投资有风险，为什么还要投资呢？哪些投资工具适合高净值人士投资_全球信息

2023-05-02 05:57:24

资讯
蔚来-SW：4月交付6658辆汽车同比增长31.2% 全球今日报

2023-05-02 03:11:51

资讯
环球即时：游戏历史上的今天（04-12）

2023-05-02 00:01:36

资讯
本赛季英超传球成功率top5：斯通斯94%最高，前五曼城占4席-今日聚焦

2023-05-01 22:11:21

资讯
环球焦点！贝恩：输给湖人会成为我们的动力，季后赛我们并非完全健康

2023-05-01 20:53:41

资讯
70+指标深度筛查！瑞慈体检套餐279元_环球新消息

2023-05-01 19:59:01

资讯
当前热门：重要提醒！8路、28路两条公交线路临时调整

2023-05-01 18:27:08

资讯
蒸汽熨斗十大名牌排名（蒸汽电熨斗怎么用）-环球简讯

2023-05-01 17:20:16

资讯
崩坏星穹铁道列车长的馈赠任务介绍

2023-05-01 16:19:28

资讯
世界速看：“五一特种兵”集合！下一站：自贡丨玩转五一

2023-05-01 15:18:38

资讯
焦点！世界速递！【环球报资讯】今日播报!为什么有的企业可以只交三险天天时讯|环球观热点当前热文|当前视点_通讯_全球实时

2023-05-01 14:37:46

资讯
还“世界最大的金融恐怖分子”，印度卢比是想取代美元地位吗？-世界观速讯

2023-05-01 13:08:50

资讯
求助寻找！16岁平度少年离家出走一个月，至今杳无音信|看热讯

2023-05-01 12:29:59

资讯
《绝代双骄》中的痴情人，有人恨了一生，有人与小鱼儿一见钟情

2023-05-01 11:38:49

资讯
环球即时看！HPESAS企业级固态硬碟出现严重韧体问题运行32,768小时候将会故障

2023-05-01 10:54:41

资讯
新媒股份（300770）新增【知识付费】概念

2023-05-01 10:10:06

资讯
淮安田野考古工作者坚守岗位与工期赛跑

2023-05-01 09:08:42

资讯
“五一”节点一线监督严防违规吃喝歪风反弹

2023-05-01 07:59:43

资讯
旅游业复苏更需诚信经营-环球快播报

2023-05-01 06:45:44

资讯
全球快报:别把自己的脚，伸进别人的鞋里（精辟）

2023-05-01 05:07:59

资讯
港府：强烈反对！立即停止！_当前看点

2023-05-01 01:35:14

资讯
长虹教学一体机使用方法_教学一体机使用方法-环球最资讯

2023-04-30 23:44:28

资讯
环球观热点：价格大降！就在南昌！

2023-04-30 22:12:14

资讯
重庆一大桥发生火灾致1死2伤

2023-04-30 21:03:55

资讯
大客流涌入各大景区和文化场馆申城今日迎客442万余人次

2023-04-30 20:04:23

资讯
焦点报道:注意！金一文化：公司股票将于2023年5月4日停牌1天2023年5月5日复牌并实施风险警示

2023-04-30 18:45:30

资讯
首张房票发出厦门创新施行“房票补偿安置”大幕拉开|重点聚焦

2023-04-30 17:48:18

资讯
环球看点！2023年中国水溶性肥料市场深度全景调研及投资前景分析报告

2023-04-30 16:09:31

资讯
辽宁单体容量最大的陆上风电项目实现全容量并网发电

2023-04-30 14:51:52

资讯
小孩拔牙后多久可以喝水_拔牙后多久可以喝水|今日视点

2023-04-30 14:07:18

资讯
静电场的描绘思考题答案_静电场的描绘

2023-04-30 12:50:52

资讯
【天天时快讯】曝光斑痕_对于曝光斑痕简单介绍

2023-04-30 11:51:00

资讯
世界微速讯：洛克人EXE合集2全HP升级在哪获取

2023-04-30 10:58:31

资讯
官方证实，扎俩“丸子头”的网红大熊猫“小丫”已去世

2023-04-30 10:15:30

资讯
提前还房贷冲击：大中型银行中5家房贷余额下降，不良率走高环球新视野

2023-04-30 09:33:33

资讯
广西千年古镇“修旧如旧” 发展露营经济“火”起来

2023-04-30 08:37:00

资讯
焦点热门:4-0！莱万连场破门，还剩6轮领先11分，巴萨不给皇马任何的机会

2023-04-30 06:56:46

资讯
奇点数怎么找奇点数环球滚动

2023-04-30 05:47:07

资讯
过江诸人人物形象_过江诸人_世界微速讯

2023-04-30 03:46:29

资讯
全球快播：花洒安装高度多少合适_花洒需要装多高

2023-04-30 01:04:25

资讯
sum求和为零显示空白_sum求和结果为0-全球快播

2023-04-29 22:58:48

资讯
一线建设者唱响奉献之歌

2023-04-29 21:24:50

资讯
中东财团：曼联欠债6亿，一笔勾销！格雷泽漫天要价，脸都不要了天天热点

2023-04-29 20:24:57

资讯
西南证券：给予川环科技买入评级，目标价位22.8元

2023-04-29 19:18:09

资讯
五一假期第一天，西湖景区接待客流量34.04万人次！你出门游玩了吗|全球新要闻

2023-04-29 18:32:17

资讯
中甲第二轮广州vs四川九牛，现场观战人数8866人-世界播报

2023-04-29 17:37:37

资讯
加强隐患排查，防范事故发生，TA们开展节前建设领域安全生产检查|资讯

2023-04-29 16:41:07

资讯
环球热头条丨“五一”假期多彩活动城市焕发不一样的“青春气息”

2023-04-29 15:55:46

资讯
天天新消息丨“新”意何来？“美好生活”里看消费升级

2023-04-29 15:17:32

资讯
【天天新要闻】新潮能源2023年一季度实现开门红净利润同比增长20.55%

2023-04-29 14:19:06

资讯
风靡一时是什么意思(风靡一世的意思)

2023-04-29 13:34:01

资讯
魔兽世界怀旧服WLK屠龙记任务攻略-每日观察

2023-04-29 12:11:51

资讯
酒店退单后再涨价？芝罘区市场监管局出手|今亮点

2023-04-29 11:30:29

资讯
前F1赛车手崩溃超级罕见的迈凯轮塞纳LM-新资讯

2023-04-29 10:45:05

资讯
焦点观察：助力高质量发展：数字中国建设按下“快进键”

2023-04-29 10:18:02

资讯
飞鹰演员表介绍（飞鹰演员表）

2023-04-29 09:21:37

资讯
天天观点：厦门钨业：4月28日融券卖出8.37万股，融资融券余额11.71亿元

2023-04-29 08:06:47

资讯
焦点速读：音乐疗愈师陆文静：抚慰他人温暖自己

2023-04-29 07:13:49

资讯
做大做强并非唯一商道嘉信理财终于“养虎为患”

2023-04-29 06:25:02

资讯
天康生物2022年净利3.02亿董事长杨焰薪酬92.6万-天天热闻

2023-04-29 05:57:18

资讯
搬得出稳得住能致富 ——崆峒区生态及地质灾害避险搬迁工程托起群众幸福新生活

2023-04-29 04:03:14

资讯
巧家县气象台发布大风预警信号蓝色预警【Ⅳ级/一般】【2023-04-29】

2023-04-29 02:12:16

资讯
石窟都-焦点播报

2023-04-29 00:48:55

资讯
全球通讯！紫河车的功效与作用图片紫河车的功效与作用

2023-04-28 22:44:19

资讯
祝贺！王明旺校长当选深圳市基金会发展促进会会长|视焦点讯

2023-04-28 22:06:06

资讯
南京师范大学心理学怎么样的分数线天天热闻

2023-04-28 21:13:35

资讯
宋慧乔夺百想视后具体详细内容是什么

2023-04-28 20:50:08

资讯
玉林：税收宣传“走心” 企业发展“焕新”-全球今日讯

2023-04-28 20:12:12

资讯

分割之后再识别对象之间关系，新模型RAM为SAM赋予新技能

推荐内容

最近更新