您现在的位置是:首页 > 人工智能人工智能
登顶CLUE榜首,度小满“轩辕”刷新预训练模型记录
cc博主2021-12-16【人工智能】618人已围观
自然语言处理是人工智能皇冠上的明珠,近日,度小满金融AI-Lab让人类摘得明珠的步伐又前进了一步。据中文语言理解领域的权威测评基准官网公布,度小满金融AI-Lab研发的轩辕(XuanYuan)预训练模型在CLUE1.1分类任务中“力压群雄”获得了排名第一的好成绩。距离人类“表现”仅差3.38分!
CLUE是中文语言理解领域最具权威性的测评基准之一,涵盖了文本相似度、分类、阅读理解共10项语义分析和理解类子任务。其中,分类任务需要解决6个问题,例如传统图像分类,文本匹配,关键词分类等等,能够全方面衡量模型性能。该榜单竞争激烈,几乎是业内兵家必争之地,例如快手搜索、优图实验室 & 腾讯云等等研究机构也都提交了比赛方案。
据悉,位居榜首的“轩辕”是基于Transformer架构的预训练语言模型,涵盖了金融、新闻、百科、网页等多领域大规模数据。因此,该模型“内含”的数据更全面,更丰富,面向的领域更加广泛。
传统预训练模型采取“训练-反馈”模式,度小满金融AI-Lab在训练“轩辕”的时候细化了这一过程,引入了任务相关的数据,融合不同粒度不同层级的交互信息,从而改进了传统训练模式。
模型设计思路有两点:
1.宏观角度,先从通用大规模的数据逐渐迁移到小规模的特定业务以及特定任务,然后去通过不同的阶段逐渐训练,直到满足目标任务。
2.微观角度,针对不同的下游分类任务,会相应的设计出定制化的分类模型。然后采用自监督学习、迁移学习等等提升模型的性能。
目前,“轩辕”还处于1.0的版本,更侧重于自然语言理解能力,在接下来的2.0版本中,研发人员会采用更大规模的数据,训练出更加通用的预训练模型,从而赋能更多的业务和领域。
度小满为何“看中”预训练模型?
预训练模型是一种迁移学习的应用,可以利用几乎无限的文本,学习输入句子的每一个成员的上下文相关的表示,它隐式地学习到了通用的语法语义知识。
换句话说,预训练模型把通用人类的语言知识先学会,然后再代入到某个具体任务。它可以将从开放领域学到的知识迁移到下游任务,以改善低资源任务;还可以使自然语言处理由原来的手工调参、依靠 ML 专家的阶段,进入到可以大规模、可复制的大工业施展的阶段。
不止是融合人类知识,预训练模型的“改善”、“大规模”、“可复制”等关键词背后意味着降成本、提效率。这和度小满金融CEO朱光““用科技服务小微企业是金融科技公司的价值和使命”的理念不谋而合。
今年5月21日,在度小满金融成立三周年之际,度小满金融CEO朱光表示,“未来三年,度小满将继续加大人工智能技术的研发投入,聚焦小微客户,持续降低小微企业主的整体融资成本,为3000万小微企业主提供值得信赖的综合金融服务。”
目前,除了预训练,度小满金融AI-Lab在文本分类、信息抽取和技术资源等方向亦有布局。在战略上会有两点侧重:首先加强自身的数据生态建设,合法合规使用用户数据,解决数据孤岛;其次通过产学研相结合,布局前沿技术,落地金融场景业务。目前,度小满与北京大学光华管理学院成立了“金融科技联合实验室”,和西安交大成立了“西安交通大学-度小满金融人工智能联合研究中心”,并与中国科学院自动化研究所共建博士后工作站,共同开展人工智能及相关领域的博士后联合招收培养。
度小满研发人员一直相信人工智能技术势必会变革金融领域的已有研究范式。因此,连接理论前沿研究与业界的技术应用研究,推动人工智能技术在金融产业中发挥更大价值,会是度小满一直的追求。
雷峰网雷峰网雷峰网(公众号:雷峰网)
雷峰网原创文章,未经授权禁止转载。详情见转载须知。
相关文章
- RIOS谭章熹:RISC-V会服务真正的元宇宙硬件 | GAIR 2021
- 香港科技大学(广州)熊辉教授:人工智能算法中的不易、简易和变易 | GAIR 2021
- 深信服超融合新品发布:两大“内功”升级,新增5大类功能40+特性
- 《蜘蛛侠:英雄无归》独家预告片发布,快来百度“元宇宙”与蜘蛛侠互动!
- 3000亿芯片巨头曝出惊天大瓜:重组案遭董事长举报国资流失超700亿;爱奇艺宣布会员涨价;华为否认20万月薪工资条|雷峰早报
- 能够降低85%的能耗,IBM和三星的新芯片设计为什么这么牛?
- “六朝古都”如何数字化焕新颜?腾讯云技术助力南京发展数字文化产业
- 萤石网络拟科创板上市 进一步发力云服务及智能家居业务
- 网站优化:新网站在交换友情链接时需要注意些什么
- 【设计开发】品牌设计与VI设计的3个重要原则
猜你喜欢
国庆节ssr二维码节点分享-永久v2ray节点-每日更新(2022/10/2)
技术好文今天星期日,cc博主继续为大家提供国庆节ssr二维码节点分享-永久v2ray节点,更新于2022年10月02日17点更新,最新v2ray节点分享。需要付费节点下方推荐点击v2rayn出门右拐即可,周末更新资源部分可用,免费资源不易,请大家珍惜。CC博客将分享持...
阅读更多存算一体AI芯片公司真与科技完成数千万美元Pre-A轮融资
芯片雷峰网(公众号:雷峰网)消息,近日,新兴AI芯片创业公司真与科技(ZenTech)宣布已于7月完成Pre-A轮融资。据悉,本轮融资规模达数千万美元,股东中包括半导体头部基金等知名投资人。官网信息显示,真与科技2022年成立于浙江省嘉兴市,专注于边缘与端侧的A...
阅读更多黑客大会遇上元宇宙:极客精神的又一次狂欢
人工智能1993年的拉斯维加斯,18岁的 Jeff Moss 正准备面临一场悲伤的别离。他的一位黑客朋友由于爸爸工作调动即将离开美国,为了给这份友谊再留下些纪念,Jeff 决定给朋友办一个盛大的告别 Party。早早开始策划,精心的筹备,但就当一切都准备妥当,却临...
阅读更多新一代华为MatePad Pro发布,智慧办公体验再次升级
业界2022年7月27日,备受期待的新一代华为MatePad Pro在“HarmonyOS 3及华为全场景新品发布会”上正式发布,拥有曜金黑、星河蓝、晶钻白、锦白四种配色,8GB+128GB版本售价3499元(仅在华为商城、部分授权电商开售)、8GB+256GB版...
阅读更多阿里新增一级业务智能互联:AliGenie三年接入4.6亿终端
业界7月20日天猫精灵伙伴大会最新消息,经过三年开放服务,智能交互系统AliGenie已接入4000万家庭用户、1000家物联平台和4.6亿终端。在此基础上,阿里巴巴日前已设立新的一级业务智能互联,探索更多消费者人工智能形态。“人工智能要有更强韧的灵魂和神经。”...
阅读更多
热评文章
长期免费ssr节点机场分享-永久v2ray节点梯子周末更新(2024/11/16)
「11月18日」2024年V2ray/Clash/SSR/Shadowrocke泰国-新加坡免费节点
清华大学获X-Embodiment最佳论文奖,机器人顶会CoRL 2024获奖名单出炉
咨询公司创始人:台积电领先英特尔主要是经济问题而非技术问题
关于iPhone梯子能连接但是上不去网的信息
旧手机搭建linux服务器怎么弄_旧手机搭建linux服务器怎么弄出来
telegream中文版下载电脑_安卓手机telegreat下载教程
海外梯子加速器怎么用的_海外梯子加速器怎么用的啊
电报是什么时候发明的_电报是什么时候发明的谁发明的
安卓加速器推荐_安卓加速器软件下载