您现在的位置是:首页 > 芯片芯片
英伟达「三芯」策略初步奏效 | ISC 2022
cc博主2022-05-31【芯片】497人已围观
相比几年前谈论的重点只有GPU,在拥有CPU和DPU之后,英伟达作为系统公司能够谈论的话题更加丰富。
在刚刚过去的Computex和时隔两年重新回归线下的ISC 2022(国际超级计算机大会),英伟达都展示了诸多其GPU、CPU、DPU的最新合作成果,这在很大程度上表明了英伟达的“三芯”策略已经初见成效。
另外,英伟达在混合量子计算中的成果,也体现了其在高性能计算领域的前瞻性布局。
当然,英伟达CEO黄仁勋也在与媒体的交流中再次强调,“英伟达是一家系统公司,提供从硬件到系统软件的全栈方案,客户可以按照其需求选择我们的产品。加速计算的世界与CPU截然不同,我们的产品和方案非常独特。”
英伟达的“三芯”到底如何加速那些世界上最快的加速系统?
独特的CPU+GPU组合
GPU作为英伟达发明的产品,也是英伟达的标签,在今年GTC 22上,雷峰网(公众号:雷峰网)介绍了英伟达最新一代Hopper架构GPU H100发布,相比两年前的Ampere架构A100 GPU,实现了数量级的性能提升。
黄仁勋表示,20个 H100 GPU 便可承托相当于全球互联网的流量,使其能够帮助客户推出先进的推荐系统以及实时运行数据推理的大型语言模型。
不过,相比GPU,英伟达的Grace CPU更能吸引外界的关注。市场上已经有很多优秀的CPU产品,英伟达在这样的背景下推出CPU让人感到意外,也让人好奇Grace CPU的不同之处。
当被问及Grace CPU有何独特之处时,黄仁勋说,“Grace旨在比其它CPU更好地解决与数据处理有关的问题,能够更高效处理大量数据,并且与我们的GPU紧密结合,更好地完成解决AI任务。”
英伟达的Grace CPU超级芯片集成了两个基于Arm的CPU,有多达144个高性能Arm Neoverse核心,并且带有可伸缩矢量扩展和1 TB/s的内存子系统,支持最新的PCIe Gen5协议,可实现与GPU之间最高性能连接,同时还能连接NVIDIA ConnectX-7智能网卡以及NVIDIA BlueField-3 DPU。
由此看来,英伟达在设计Grace CPU之处就已经非常明确要将其所有硬件产品之间很好地互联。这也容易理解,随着摩尔定律的放缓,异构计算成为了未来趋势,作为提供高性能计算产品的公司,英伟达有这样的布局也十分合理。
ISC 2022上,英伟达CPU+GPU的产品组合获得了认可,美国和欧洲的领先超级计算中心都将率先采用这两款超级芯片。
美国阿拉莫斯国家实验室(LANL)今日宣布,其新一代系统Venado将成为美国首个采用NVIDIA Grace CPU技术的系统。Venado是使用HPE Cray EX超级计算机构建而成的异构系统,将同时配备Grace CPU和Grace Hopper,这一系统建成后的AI性能预计将超过10 exaflops(10的18次方,百亿亿次)。
另一个率先采用英伟达Grace CPU和GPU的系统是瑞士国家计算中心的新系统Alps,基于HPE Cray EX超级计算机构建,这是一个通用系统,向瑞士及其他国家的研究者开放。
英伟达还宣布,源讯、戴尔科技,技嘉科技、慧与、浪潮、联想和超微宣布计划部署基于Grace CPU和Grace Hopper超级芯片的服务器。
DPU带来的大幅性能提升
DPU是一个新概念,在英伟达带动下成为备受关注的产品,涌现了大量初创公司以及资本的投入
DPU的核心价值是将通信和计算负载从CPU卸载,进而获得巨大的性能提升。不过DPU能够带来的具体的性能提升,仍然需要实践证明,英伟达借着ISC 2022给出了一些案例。
洛斯阿拉莫斯国家实验室(LANL)的杰出高级科学Poole 正与英伟达进行一项为期多年的广泛合作,旨在将计算多物理应用的性能提高30倍。这其中包括使用 BlueField 及其NVIDIA DOCA软件框架在计算存储、模式匹配等。
LANL 已经感受到网络计算的强大功能,加速闪存盒(ABoF)将固态存储与DPU和InfiniBand加速器相结合,可为 Linux 文件系统的关键性能部分提供加速。它的性能高达同类存储系统的30倍,并将成为 LANL 基础架构中的关键组件。
俄亥俄州立大学的研究人员展示了 DPU 如何将一个HPC热门编程模型的运行速度提高 21%。他们通过卸载消息传递接口(MPI)的关键部分,加速了P3DFFT,这是一个用于众多大规模HPC仿真的数学库。
对于运行药物研发或飞机设计等HPC仿真应用的超级计算机,DPU也能够带来高达两位数的性能加速。
欧洲的多个研究团队正利用BlueField DPU 加速 MPI 和其他 HPC 工作负载。英格兰北部的达勒姆大学正在开发一款软件,用于在 16 个节点的 Dell PowerEdge 集群上使用 BlueField DPU 以实现 MPI 作业的负载均衡。剑桥大学、伦敦和慕尼黑等的研究人员也在使用 DPU。
DPU也在用于加速分子动力学研究,还能用于气候学、天体物理学、大数据、AI 和更多方面的研究。这些研究人员也在考虑如何使用新一代的BlueField-3 DPU 的核心功能。
三芯策略初步奏效,布局量子计算
高性能计算系统对于算力有着更高要求,也有独特需求,在英伟达拥有了GPU、CPU和DPU之后,它能够实现更多的硬件组合,再配合上层的软件系统,能够更好满足前沿应用和更高计算的需求。
通过ISC 2022的众多成果展示,也能看到英伟达的三芯策略已经初见成效,不同的产品和产品组合已经在HPC、AI等应用中实现性能的显著提升。
不止于此,英伟达还在布局前沿的量子计算。
量子计算有两大优势,一个是可以为海量数据的并行计算(性能)带来指数级别的提升,这种强大的功能,可以运用在包括金融、数据的搜索处理等领域。另一个是量子计算编译在电子原子上,在模拟方面会表现的非常自然,例如新材料的发现,生物医药的药物合成。
不过,量子计算的实现还有很多挑战。随着量子系统的发展,下一个重大飞跃是朝混合系统迈进:量子计算机和经典计算机协同工作。
因此,摆在面前的一个重要任务就是将传统系统和量子系统桥接到混合量子计算机中。GPU适合与量子计算协同工作,能大幅降低经典计算机和量子计算机之间的通信延迟,解决当今混合量子作业面临的主要瓶颈。
据悉,已经有数十家量子组织已经在使用 NVIDIA cuQuantum 软件开发套件,在GPU上加速其量子电路模拟,能够在主要的量子软件框架上实现加速计算。比如,AWS展示了cuQuantum如何在量子机器学习工作负载上实现高达900倍的加速。
在经典计算的层面,英伟达不断通过丰富硬件产品和软件生态保持争力,面向未来的量子计算,英伟达也做好了准备。
Tags:ps4加速器
相关文章
- AI交互成行业发展核心,科沃斯再次引领服务机器人行业进化
- 元宇宙创新者1:概念爆火后,才被世界看到的图形学大牛们
- 香港CN2云服务器1核 1G 5M 不限流量 138元/年提速啦
- 2022永久稳定ssr节点,v2ray节点免费订阅地址实时更新(2022/5/30)
- 香港云服务器 1核 1G 1000M59元/月物语云
- 加强“一带一路”合作,优必选科技助力越南及新加坡人工智能教育
- IEEE Fellow黄建伟:「网络经济、群体智能」跨界融合,智慧城市的新风暴
- 活动预告 | 科技加持,保险业数字化转型进入关键“下半场”
- 康奈尔计算学院院长Kavita Bala:「元宇宙」算什么?上帝之眼或将通过 AI 诞生
- 机器人落地「秘诀」:持续学习、知识迁移和自主参与
猜你喜欢
窗口期即将关闭,本土MCU市场格局有何变化?
芯片在经历了将近两年的缺芯涨价之后,先前供不应求的微控制器(MCU)市场快速退烧,价格明显下滑。据央视新闻报道,意法半导体的一颗MCU芯片,价格从2021年的200元每颗降至为20元每颗,价格跌去近9成。事实上,通用型MCU本身并不昂贵,2020年之前,通用MC...
阅读更多莱斯大学胡侠团队 ICML 2022 杰出论文: 新型图数据增强方法 G-Mixup|附作者对话
人工智能作者|李梅编辑|陈彩娴近日,备受关注的第十九届机器学习国际会议(ICML 2022)在美国马里兰州巴尔的摩市举办。自新冠疫情以来,大会首次恢复线下形式,采取线上线下结合的方式举办。1ICML2022概况本届大会共收到5630 篇投稿,其中,1117 篇被...
阅读更多受宏观环境影响,Snap示警本季营收、获利恐难达标,股价盘后暴跌超30%
业界周一(23日),Snap首席执行Evan Spiege在给员工的一份报告中警告称,公司本季营收和获利表现恐低于财测预估,盘后股价闻讯暴跌30%。同时,为了管理开支,Snap还将在今年年底前放缓招聘。Spiegel写道:“宏观环境恶化的速度比我们上个月发布季...
阅读更多性功能障碍表现有哪些
健康问答性功能障碍表现有哪些,性功能障碍表现为举而不坚、坚而不久、阳痿、早泄、混身乏力、房事后腰酸背痛、冒虚汗等症状,同时由于生理以及心理产生的原因,性功能障碍往往也会对性生活产生不良结果,影响性生活得正常进行,从而导致夫妻双方出现性生活不和谐,不能很好的满足双方,那...
阅读更多数字人民币App上架;快手再传裁员:覆盖四大事业部,个别团队裁员比例30%;丰田超越通用成为美国销量最大车企|雷峰早报
业界国内新闻数字人民币App上架了2022年1月4日,数字人民币App迎来重要升级,将此前的“测试版”正式升级为“试点版”。目前,试点地区用户均可以注册成为白名单用户。目前,试点区域包括深圳、苏州、雄安、成都、上海、海南、长沙、西安、青岛、大连及冬奥会场景(...
阅读更多