您现在的位置是:首页 > 人工智能人工智能
AIGC 席卷 AI 顶会:ICLR 2023 论文得分出炉,扩散模型研究暴增
cc博主2022-11-09【人工智能】585人已围观
编辑 | 陈彩娴
11 月 5 日,人工智能顶级会议 ICLR 2023 的评审结果正式发布。
除了讨论提交论文的分数、录用可能性、如何 rebuttal 之外,Diffusion Model(扩散模型)成了今年 ICLR 的热门关键词之一,以扩散模型为研究主题的投稿论文数量出现暴涨,所涵盖的具体方向也十分广泛。
ICLR 2023 的论文提交截止日期是今年的 9 月 28 日,距离文本生成图像模型 DALL·E 2 的问世不过 5 个月,Stable Diffusion 的发布也只是在 8 月份。扩散模型这一波研究热潮,实在是“扩散”得飞快,AIGC 的兴起正当时。
ICLR 2023 审稿概况
ICLR 全称是 International Conference on Learning Representations(国际学习表征会议),由深度学习三巨头其中的两位 Yoshua Bengio 和 Yann LeCun 牵头创办于2013年,在人工智能领域地位举足轻重。ICLR 2023 将于 2023 年 5 月 1 日至 5 月 5 日在卢旺达基加利举行。
本届会议共计有 6300 份初始摘要投稿和 4922 份经过评审的投稿,其中经过评审的投稿比去年增加了 32.2%。在 4922 份投稿中,有 99%(4883)得到了至少 3 份评审,一共有超过 18500 份评审。
图注:历年ICLR接收投稿数量ICLR 的审稿分数和意见全部在 OpenReview 平台上公开,一些网友已经爬取了平台上本轮审稿的论文得分数据,做了相关排名统计。
论文评分方面,今年的论文平均得分为 4.95。最终的论文录用结果尚未公布,参照上一年 32.3% 的录用率,今年共有 1556 篇左右的论文有希望被录用,最低均分线在 5.50 分。
图注:ICLR 2023 论文评分分布
扩散模型成大热门
毫无疑问,扩散模型在今年是一个大热门,从 ICLR 2023 的论文投稿情况就能看出,这波研究热潮已经掀起。
从提交论文的主题来看,最热门的方向与往年相差不大,强化学习、深度学习、表征学习、图神经网络等仍旧是热点。而其中尤其引人注目的,是排在第 14 名的 Diffusion model。
图注:2022 年和 2023 年 ICLR 论文投稿关键词频率比较从下图显示的频率排名变化幅度最大的前 10 个论文关键词可以看到,去年的 Diffusion model 还排在第 173 名。
论文题目中的关键词频率也印证了扩散模型的研究热度有多高:
上图是论文标题关键词频率排名变化幅度最大的前 10 个关键词,diffusion 位列第 2,从去年的第 132 名大幅暴增到第 25 名。
甚至有网友开玩笑,不如就把 ICLR 2023 的名字改为“Diffusion Conference 2023”吧......
据粗略统计,ICLR 2023 的论文投稿中,有 100 多篇论文以扩散模型为研究主题,在 233 篇得分为 7分(含)及以上的论文中,共有 13 篇涉及扩散模型。
这些工作所涵盖的具体方向也十分广,如高效采样、与其他生成模型结合、在CV/NLP领域的应用、在多模态领域的应用、与强化学习结合、分子图建模、扩散模型理论与理解、扩散模型泛化与拓展、扩散模型迁移、特殊结构数据的建模、鲁棒性与稳定性、扩散模型的隐私保护,以及其他方向。
研究提出的生成模型涉及多个模态,模型本身的名字也是五花八门,过去几个月令人惊艳的许多生成模型都在其中,如:
来自谷歌的文本生成 3D 模型 DreamFusion(被称为“3D 版 DALL·E”),论文还得到了 8.0 的高分,总排名第 13。
另外还有谷歌发布的检索增强的文本生成图像模型 Re-Imagen、文本生成视频模型 Phenaki,Meta 的文本生成视频模型 Make-A-Video等等。
扩散模型所引发的这一波 AIGC 热潮是席卷式的。扩散模型第一次被提出是在 2015 年(DPM,Diffusion Probabilistic Models),直到2020年,UC 伯克利的Pieter Abbeel 等人提出去噪扩散概率模型(Denoising Diffusion Probabilistic Model, DDPM),在图像生成方面击败了 GAN,向世界展示了扩散模型的威力。
论文地址:https://arxiv.org/pdf/2006.11239.pdf
而扩散模型真正开始成为研究热门,今年 4 月 OpenAI 发布的文本生成图像模型 DALL·E 2 居功至伟,之后又有谷歌推出 Imagen,直接对标 DALL·E 2,文本生成图像领域从此开始卷了起来。
今年 8 月,初创公司 Stability.AI 发布深度学习文生图模型 Stable Diffusion,开源后更是一石激起千层浪,后续基于扩散模型的文本生成图像模型可以说是越来越卷,并很快扩展到文本生成视频、文本生成 3D、文本生成音频等等。
如今,扩散模型已经当之无愧成为深度生成模型中新的 SOTA,其所引发的 AIGC 热潮已经势不可挡。
所以,想要进入 AIGC 这一赛道的可以早点行动了。
参考链接:https://twitter.com/shiqiang_w/status/1588714893309804545https://openreview.net/group?id=ICLR.cc/2023/Conferencehttps://guoqiangwei.xyz/iclr2023_stats/iclr2023_submissions.html更多内容,点击下方关注:扫码添加 AI 科技评论 微信号,投稿&进群:未经「AI科技评论」授权,严禁以任何方式在网页、论坛、社区进行转载!
公众号转载请先在「AI科技评论」后台留言取得授权,转载时需标注来源并插入本公众号名片。
雷峰网(公众号:雷峰网)
雷峰网版权文章,未经授权禁止转载。详情见转载须知。
Tags:
相关文章
- 联想柏鹏:融合化、场景化、订阅化、绿色化的“新算力”,创造数智新时代
- 天玑9200,不怕热?
- 联想Thinker分享:共同成长三十年,共创数智新征程
- 联想Think三十载|创新突破,品质立命,科技助力行业智能化转型
- 亮点直击、不容错过 | 2022联想创新科技大会·ISG分论坛即将开启
- 台泥携手希迪智驾 宣布正式进入矿山无人零碳时代
- 全域经营模式快速发展 助力新职业发展与高质量就业
- AI 大牛 Michael Jordan 获 2022 年顶科协“智能科学或数学奖”
- 最新稳定ss/ssr节点机场分享-v2ray节点订阅每日更新(2022/11/8)
- 日本头部视频平台Smash与腾讯云达成合作,快直播技术降低70%播放延时
热门文章
- 香港VPS低至6折93元/年,全场8折,香港CN2,洛杉矶CN2 GIA,洛杉矶9929,洛杉矶CMIN2,日本大阪/东京IIJ,日本BGP,韩国BGP,英国伦敦AS9929住宅IP
- 低至4折,2核4GB内存VPS/GPU独服 $2.99/月起,GPU VPS/GPU专用服务器 $13/月起,物理专用服务器$29/月起,可免费试用
- 知乎直答亮相“学术酒吧”开放麦,李开复、刘知远相聚“AI上头俱乐部”
- MIT 热门研究:AI 工具“带飞”科研,但也严重加速内卷
- 美国/香港VPS年付99元起,双核/2GB/15GB SSD/500GB流量@100Mbps带宽
- 国行 iPhone 16 相机控制也接入视觉智能了!可一键调用阶跃星辰智能助手「跃问」
- RISC-V要成为「显性」技术,到了关键时期
- 英伟达CFO称Blackwell需求量惊人,已向合作伙伴发出1.3万个样片
- 黄仁勋亲述创业故事:两次都差点倒闭
热评文章
「11月18日」2024年V2ray/Clash/SSR/Shadowrocke泰国-新加坡免费节点
MIT 热门研究:AI 工具“带飞”科研,但也严重加速内卷
国行 iPhone 16 相机控制也接入视觉智能了!可一键调用阶跃星辰智能助手「跃问」
知乎直答亮相“学术酒吧”开放麦,李开复、刘知远相聚“AI上头俱乐部”
黄仁勋亲述创业故事:两次都差点倒闭
低至4折,2核4GB内存VPS/GPU独服 $2.99/月起,GPU VPS/GPU专用服务器 $13/月起,物理专用服务器$29/月起,可免费试用
RISC-V要成为「显性」技术,到了关键时期
香港VPS低至6折93元/年,全场8折,香港CN2,洛杉矶CN2 GIA,洛杉矶9929,洛杉矶CMIN2,日本大阪/东京IIJ,日本BGP,韩国BGP,英国伦敦AS9929住宅IP
英伟达SC24六大技术亮点,不止加速超算500强
美国/香港VPS年付99元起,双核/2GB/15GB SSD/500GB流量@100Mbps带宽