您现在的位置是:首页 > 芯片芯片
MLPerf 最新结果公布,Arm 服务器亮眼首秀
cc博主2021-10-02【芯片】693人已围观
cc博客网消息,本周三,MLCommons 公布最新 MLPerf Inference V 1.1 基准测试(Benchmark)结果。与 V 1.0 版本相比并无太大区别,只不过在边缘推理的测试场景中,串流传输被弃用,不再作为基准测试的一部分。
新一轮基准测试中,在 AI 领域占优势的英伟达依然是唯一一家提交了从数据中心到边缘所有 MLPerf 基准测试类别数据的公司。不同的是,此次基准测试中,英伟达第一次在 Arm 系统上进行数据中心测试,并取得不错的成绩。
Arm 服务器推理性能接近 x86
由于能效性能的不断增长和强大的软件生态系统,Arm 架构正在向全球各地的数据中心进军,而在此次MLPerf 基准测试中,Arm 服务器也被纳入其中。
英伟达展示的基准测试结果表明,如果以 A30 GPU 为标准,基于 x86 服务器和 Arm 服务器的处理速度均有提升。离线(Offline)测试中,基于两种服务器的 A100 处理速度差别不大,相比于 A30 的处理速度均有接近 2 倍的提升;服务器(Server)测试中,A100 相比于 A30 有 1 至 3 倍的提升,在语音识别 RNN-T 模型中,基于 x86 的 A100 处理速度与基于 Arm 服务器差别较大。
另外,本次基准测试中,A100 也同时基于 Ampere Altra CPU 的 Arm 服务器和英特尔的 x86 服务器上进行了测试。
作为 GPU 加速的平台,在 AI 推理工作中,使用 Ampere Altra CPU 的 Arm 服务器的性能稍逊于具有类似配置的 x86 服务器,但在 3D-Unet 工作负载测试中,基于 Arm 服务器的 A100 性能得分超过了 x86 服务器。
一直以来支持所有 CPU 架构的英伟达表示,十分高兴能够看到 Arm 在同行评审中的行业基准测试中能够证明其 AI 性能。
Arm 高性能计算和工具高级总监 David Lecomber 表示: “最新推理结果表明,Arm CPU 和 NVIDIA GPU 驱动的 Arm 系统已能够应对数据中心中的各种 AI 工作负载。”
AI 推理性能四个月内提升 20%
此次基准测试中,英伟达一如既往地展示了其 AI 推理性能,英伟达凭借其架构设计配合软件再次取得突破。
与 MLPerf 0.7 版本相比,本次测试中英伟达 A100 GPU 各类工作负载得分均有提升。其中,医学图像 3D U-Net 模型涨幅高达 150%,语音识别 RNN-T 模型测试涨幅高达 130%。
事实上,在今年 4 月份 MLPerf 1.0 版本中,A100 GPU 的推理能力就已经在推荐系统模型 DLRM,语音识别模型 RNN-T 和医疗影像 3D U-Net 模型方面有一定提升,提升幅度最高达 45%,而此次又取得新突破,相比四个月前提升了 20%。
根据英伟达的介绍,其完整的 AI 软件堆栈是提升其 GPU 性能的关键。
英伟达 TAO Toolkit 可以简化迁移学习过程,用户能够在熟悉的环境中优化模型;英伟达 Tensor RT 软件对 AI 模型进行了优化,使其能够最有效地运用内存并且实现更快的运行速度。Trition 推理服务器能够简化云端、本地数据中心或边缘的服务部署,支持不同应用中的欺诈检测、包裹分析、图像分割等各类任务。
此外,在多实例 GPU(MIG)技术的支持下,英伟达 A100 能够提升将近 7 倍的 GPU 资源,即在一块 GPU 上运行 7 种工作负载,而 A30 只能支持 4 种工作负载。
英伟达的 AI 优势不仅仅体现在自家 GPU 的得分上,此次基准测试中,共计 7 家 OEM 厂商提交了 22 个 GPU 加速平台,这些服务器中大多数都是英伟达认证系统,很多型号都支持上个月正式发布的英伟达 AI Enterprise 软件。
英伟达的 AI 技术已经得到广大生态系统的支持,此次与 Arm 系统的合作,也从侧面反映了英伟达进军 Arm 的决心。
文中图片源自英伟达官方 cc博客网cc博客网cc博客网(公众号:cc博客网)
相关文章:
IPU首度公开MLPerf成绩,性价比收益胜过英伟达
AI基准测试MLPerf模型少、更新慢,地平线提出的MAPS会更好吗? | CCF-GAIR 2020
为什么平头哥和英伟达在MLPerf基准测试中都获得了第一?
Tags:免费机场
相关文章
- 收购百年光学企业后,这家欧洲半导体巨头重仓自动驾驶
- 前博通副总裁创业,9个月流片,性能赶超对手十多年迭代的高端视觉芯片
- A15勇夺第一,却掩盖不了苹果 iPhone 的心病
- 紫光展锐如何冲上手机处理器市场的全球第四?
- 国内半导体设备厂商弥费科技获超亿元A轮融资,启明创投领投
- All in 物联网后,芯科科技放出三大招
- 采用Intel 4制程,Loihi 2神经拟态计算芯片神经元最多达100万个
- 国产半导体设备商凌波微步获千万融资,打入国内封测龙头
- 全球最大智能模型“悟道”首次落地:数字人+终端AI助手,支持NVIDIA GTX单卡机运行百亿大模型
- “养成系”AI人才:谷歌2021博士奖研金名单公布,华人学者榜上有名
猜你喜欢
Demis Hassabis:AI 的强大,超乎我们的想象
人工智能有人认为 AI 已经穷途末路,但一些绝顶聪明的人还在继续求索。整理|黄楠、王玥编辑|陈彩娴近日,DeepMind 的创始人 Demis Hassabis 作客 Lex Fridman 的播客节目,谈了许多有趣的观点。在访谈的一开头,Hassabis 就直言图...
阅读更多反电信网络诈骗法(草案)提请二审 权威解读来了!
业界近日,《中华人民共和国反电信网络诈骗法(草案)》(本文以下,简称“《草案》”)提请十三届全国人大常委会第三十五次会议二次审议。相较于初审稿(2021年10月19日,提请十三届全国人大常委会初次审议)中的39项条例,本次增加至46项。新增内容包括:出入境人员管控...
阅读更多ACM 杰出会员姬水旺:量子化学和物理的深度学习
人工智能整理丨汪浩文校对丨维克多量子技术和人工智能都是当前最先进的科学技术,前者被寄希望于拥有超强的计算能力,后者已经在各行各业“大杀四方”。当两者相遇会碰撞出什么样的火花?人工智能又能在哪些方面助力量子技术?去年12月份,德州农工大学计算机科学与工程系(校长有...
阅读更多宝信软件与腾讯云达成全面战略合作,助力制造业数字化转型升级
业界数字技术已成为制造业增强竞争力的重要抓手。2月17日,上海宝信软件股份有限公司(下简称“宝信软件”)与腾讯云达成全面战略合作,将在行业基础云平台建设、工业互联网发展、创新解决方案研发等领域开展联合探索,推动制造业企业数字化转型升级,助力实体经济高质量发展。...
阅读更多第四季财报多项数据创历史新高,中芯国际高管这样看
芯片2022年2月10日,国内芯片行业龙头中芯国际公布了其2021年第四季度财报。财报显示,第四季度中芯国际销售额为15.8亿美元,相较于 2021 年第三季度的14.1亿美元同比增长 11.6%。第四季度利润为5.52亿美元,利润率达到了35%。全年销售额达到5...
阅读更多
热评文章
2024年V2ray/Clash/SSR/Shadowrocke俄罗斯-美国免费节点梯子更新(11/6)
长期免费ssr节点机场分享-永久v2ray加速器订阅-每日更新(2024/11/4)
2024年V2ray/Clash/SSR/Shadowrocke印度-美国免费节点机场(11/8)
95 后创业者 VAST 宋亚宸:要做3D「抖音」内容平台
RISC-V基金会如何支持HPC和AI领域的公司?
纸飞机汉化包ios_纸飞机汉化包提示有后门
vps加速器免费加速极光_免费加速器永久免费版不用登录
飞机下载链接_飞机下载链接官网
旋风加速度器xfvzcc_旋风加速度器x353cc功能介绍
搞笑电报员口吐芬芳_电报员口吐芬芳无消音