您现在的位置是:首页 > 人工智能人工智能
ICCV2021 | 武汉大学提出“变化无处不在”单时相监督的变化检测器
cc博主2021-10-13【人工智能】872人已围观
第一作者主页:https://zhuozheng.top
该工作是武汉大学测绘遥感信息工程国家重点实验室RSIDEA团队在变化检测方面的工作,已被ICCV 2021接收。针对成对双时相变化检测训练样本标注耗时、收集困难的问题,提出了一种新颖的弱监督学习算法STAR (Single-Temporal supervised LeARning),其利用非成对单时相遥感影像构造伪双时相监督信号,以学习变化表征;同时提出了一种变化检测新架构ChangeStar,其通过核心模块ChangeMixin,可将任意语义分割模型转化为变化检测器,从而复用现有的优秀架构,揭示了语义分割与变化检测之间的内在联系。实验表明,单时相监督下的ChangeStar较Baseline取得显著提升, 在Zero-Shot验证条件下,与强监督模型精度差距缩小到10%以内;在强监督(双时相监督)的设定下,基于FarSeg的ChangeStar在LEVIR-CD数据集上实现了state-of-the-art的精度。变化无处不在
我们观察到,成对标记的位时图像的重要性在于,变化检测器需要成对的语义信息来定义对象变化检测的正负样本。这些正、负样本通常是由两个不同时间的像素在同一地理区域是否具有不同的语义来决定的。位时像素的语义控制着标签分配,而位置一致性条件(两个时相的像素应处于相同的地理位置)仅用于保证独立同分布的训练和推理。可以想象,如果我们松弛位置一致性条件来定义正负样本,那么变化是无处不在的,尤其是在未配对的图像之间。
方法简介
2.1 单时相监督学习算法STAR: Single-Temporal supervised LeARning
STAR旨在通过带有语义像素标签的任意图像对学习一个可泛化的变化检测器。为了实现这一点,我们构造了伪双时相图像对,松弛了传统的双时相监督的变化检测学习问题,如下式:其中Xi, Xj为真实双时相图像对,对应的Y是其语义像素标签,F为变化检测器,为变化检测器参数。将伪双时相图像对(Xt1, Xt1)替换为真实双时相图像对,并重新利用逻辑异或运算分配伪双时相图像对的变化标签,从而将原学习问题松弛为下式的仅利用单时相图像即可完成的学习问题:
伪双时相图像对:为了利用单时相图像提供监督信号,我们提出了一种伪双时相图像对构建技术,其通过对一个训练批次中的图像Xt1进行随机排列得到伪第二时相图像Xt1,并且保证每个伪图像对中的图像各不相同。通过观察可以发现,伪双时相图像对的变化标签可用两张图像的语义像素标签(one-hot为二值标签)的逻辑异或表示,这样即可完成伪双时相图像对的正负样本定义。
图1:模型训练与推理流程
2.2 变化检测新架构ChangeStar = Any Segmentation Model + ChangeMixin
ChangeStar是一个简单而统一的网络,由一个深度语义分割模型和ChangeMixin模块组成。这种设计的核心思想在于重用现代语义分割架构,因为语义分割和物体变化检测都是密集的预测任务。为此,我们设计了ChangeMixin模块,使任何现成的深度语义分割模型能够检测物体变化。ChangeMixixin模块由若干卷积层和一个时序交换模块组成,其输入由分割模型计算得到的高分辨率语义特征,输出双向的变化检测图用于后续的学习与推理。我们在实验中发现,一个收敛的模型,双向变化检测图相似度极高,因此在推理阶段我们选择其中一个方向的变化检测图作为最终预测值。
主要实验结果
这部分展示了所提出方法在不同训练数据与测试数据下的泛化性实验结果。对比方法采用基于深度语义分割模型的分类后比较法,作为单时相监督的基线。实验结果表明,所提出的方法可有效提升单时相监督下的变化检测性能,具有很好的泛化性能。
同时为了验证所提出架构的有效性,我们在双时相监督下训练了ChangeStar模型的各种变体。实验结果(表4)表明ChangeStar架构对已有的分割模型具有良好的兼容性,在相同骨干网络的情况下可取得更加优异的性能。
为了了解单时相、双时相监督之间的实际差距,我们利用相同模型开展了多组对照实验,从实验结果中可以发现,单时相监督作为一种弱监督信号,与双时相监督这种强监督信号相比仍有一定差距,但差距随着骨干网络容量的提升而减小,目前F1精度差距最小可缩小到10%以内。然而本文提出的方法仅仅是在单时相监督上的初步探索,未来还有更大的改进空间,例如使用模型容量更大的transfomer模型作为基础模型、更大的单时相监督数据、更好的单时相监督学习策略都是值得未来探索的研究话题。
更多的消融实验与讨论可见原文。
总结
在这项工作中,我们提出了单时相监督学习算法(STAR),从而巧妙绕过了传统的双时相监督学习中收集成对标记数据成本高的问题。STAR提供了一个利用任意图像对中的物体变化作为监督信号的新视角。为了证明STAR的有效性,我们设计了一个简单而有效的多任务架构,称为ChangeStar,用于联合语义分割和变化检测,它可以通过进一步提出的ChangeMixin模块重新使用任何深度语义分割架构。
大量的实验分析表明,提出的方法可以以较弱监督信息学习一个鲁棒的变化检测器;同样双时相监督条件下,超越了目前的state-of-the-art方法。我们希望STAR将作为一个坚实的基线,在未来服务于弱监督变化检测研究。
cc博客网(公众号:cc博客网)
cc博客网版权文章,未经授权禁止转载。详情见转载须知。
相关文章
- 深度学习为何泛化的那么好?秘密或许隐藏在内核机中
- 稳定免费ssr节点账号链接分享-最新v2ray节点更新2021/10/13
- 让中小企拥有链上信用 Trusple用区块链提升企业跨境贸易效率
- 洛杉矶cera特价,2核 4G 30M 29元/月起,可选Windows/可自定义配置青云互联
- 腾讯云携手全球咨询公司毕马威 共同助力数字经济发展
- 苹果再次上诉Epic,App Store允许第三方支付搁浅
- 旷视技术分享会首期“开课”:AI多摄助力手机影像突破
- 探索生态文明,展示中国智慧,CBD COP15我们“云上见”
- 2021中国IPv6创新发展大会召开,腾讯云成功入选优秀案例
- 阿里巴巴研发投入位居中国民营企业第二、互联网企业第一
猜你喜欢
Google可编程搜索引擎添加URL问题
站长动态网站管理员在使用Google可编程搜索引擎的时候,会发现一个奇怪的问题,就是网站URL的末尾会自动添加#gsc.tab=0后缀。如果通过Google可编程搜索引擎的搜索框进行搜索,这个表情也会添加到URL结尾。如果我们在网站上删除Google可编程搜索...
阅读更多MIT 最新研究:AlphaFold 蛋白质预测能力太差,目前利用价值还很低
人工智能作者 | 李梅、黄楠编辑 | 陈彩娴2018 年,Deepmind 首次发布基于深度神经网络的蛋白质结构预测数据库 AlphaFold,在蛋白质预测中实现了最先进的性能;去年,AlphaFold 2 获得了 98.5% 的蛋白质预测率;前段时间,Deepmi...
阅读更多核心业务营收大跌33%,英伟达连续两季业绩未达预期
芯片昨日,英伟达公布了今年第二季度的财报。财报显示,英伟达第二季度收入为67.0亿美元,同比增长3%,环比下降19%,这与两周前英伟达发布的业绩预览基本相当。这标志着英伟达今年一、二季度业绩均未达到分析师预期。具体来看,今年第二季度英伟达两大支柱业务一升一降:...
阅读更多Apache基金会正式宣布Apache InLong成为顶级项目
业界刚刚获悉,全球最大的开源软件基金会Apache软件基金会正式宣布,Apache InLong成为成功从Apache孵化器毕业成为社区顶级项目,这也是Apache社区首个一站式大数据集成顶级项目。这个最初由腾讯捐献给Apache社区的一站式海量数据集成框架,可以...
阅读更多香港云服务器 1核 1G 1000M59元/月物语云
服务器评测物语云计算(MonogatariCloud)是一家成立于2016年的老牌国人商家,主营国内游戏高防独服业务,拥有多家机房资源,产品质量过硬,颇有一定口碑。本次带来的是中国香港Cera机房的G口大带宽E5-2680v4千兆带宽VPS,去程CN2/BGP/NTT...
阅读更多