您现在的位置是:首页 > 芯片芯片
全球首款3D晶圆级封装处理器IPU发布,突破7nm制程极限
cc博主2022-03-03【芯片】494人已围观
雷峰网消息,本周四,总部位于英国的AI芯片公司Graphcore发布了新一代IPU产品Bow,这是其第三代IPU系统,发布即面向客户发货。与上一代IPU相比,Bow IPU性能提升40% ,能耗比提升了16%,电源效率也提升16%。
值得注意的是,这一次Bow IPU的性能提升并非主要依赖采用更先进的制程,Bow IPU采用了和上一代IPU相同的台积电 7nm,通过采用和台积电共同开发的先进硅晶圆堆叠技术(3D Wafer-on-Wafer)达到性能和能耗比的提升。
Bow作为世界首款3D WoW处理器,证明了芯片性能提升的范式从先进制程向先进封装转移的可行性。
新一代 IPU 性能提升40%,价格保持不变
2016年,Graphcore成立并开创了全新类型处理器架构IPU,因其在架构上的创新曾被英国半导体之父Hermann Hauser称之为是计算机历史上的第三次革命。
经历6年时间的发展,Graphcore的IPU逐渐在在金融、医疗、电信、机器人、云和互联网等领域取得成效。本周四,Graphcore又推出了第三代产品Bow IPU。
据Graphcore介绍,第三代IPU相对于上一代M2000,性能提高40%,每瓦性能提升16%,即能耗比实现16%的提升。不过,AI芯片的真实性能还需要放在不同的应用领域中讨论。为此,Graphcore也给出了在不同垂直领域中Bow的性能表现。
在图像方面,无论是典型的CNN网络,还是近期比较热门的Vision Transformer网络,以及深层次的文本到图片的网络,与上一代产品相比,Bow IPU都有30%到40%的性能提升,在EfficientNet-B4这一项中,接近理论上限值。
BERT训练模型是自然语言方面的经典模型,基于BERT,OpenAI提出了GPT-1、GPT-2、GPT-3等纵向扩展或横向扩展,通过更深的网络层次和更宽的网络宽度让模型的性能和精度进一步提高。
“我们可以看到,这些模型在我们最新的硬件形态上都有很大的性能提升。”Graphcore中国工程副总裁、AI算法科学家金琛介绍道。
不仅如此,转换到实际模型中的吞吐量,与IPU POD64相比,在计算机视觉的ResNet50 和 EifficientNet-B4 训练模型中,Bow Pod64的吞吐量能够达到34%和39%的性能提升。自然语言方面, BERT-Large Ph1 预训练模型和语音识别Conformer Large 训练模型,后者都有36%的吞吐量提升。
作为英伟达的竞争对手,Graphcore自然不忘将 Bow Pod16 与DGX-A100进行对比,实验数据表明,EfficientNet-B4的backbone的训练在DGX-A100上需要花费70个小时的训练时间,而在Bow Pod16上,只需要14小时左右。
接近理论极限的性能提升,Graphcore Bow IPU是如何实现的?
5nm不再是首选,采用先进封装性价比更高
从芯片的规格上看,Bow IPU是世界上第一款基于台积电的 3D Wafer-On-Wafer的处理器,单个封装中拥有超过600亿个晶体管,具有350 TeraFLOPS的人工智能计算的性能,是上一代MK2 IPU的1.4倍。片内存储较上一代来看没有变化,依然保持0.9GB的容量,不过吞吐量从47.5TB提高到了65TB。
“变化主要体现在,它是一个3D封装的处理器,晶体管的规模有所增加,算力和吞吐量均得到提升。” Graphcore大中华区总裁兼全球首席营收官卢涛说道。而在大家都关注的工艺制程上,Bow IPU 延续了上一代台积电 7nm 工艺制程,没有变化。
理论上,一颗芯片的性能提升很大程度上取决于工艺制程上的进步,但随着工艺制程越来越逼近物理极限,摩尔定律逐渐失效,业界不得不寻找新的技术方向来延续摩尔定律。其中,3D封装就是被业界广泛看好的技术方向。
中国工程院院士、浙江大学微纳电子学院院长吴汉明就曾在一次演讲中提到,如果将芯片制造和芯片封装相结合,也可以做到65nm工艺制程实现40nm工艺制程的性能功耗要求。
Bow IPU正好验证了吴院士的观点。
卢涛表示,Bow IPU产品性能的提升主要来源于3D WoW和新增的Die。
至于为何选择改变封装方式而不是更先进的工艺,卢涛则表示MK2 IPU有594亿个晶体管,大概823平方毫米,已经是7nm单个Die能够生产的最精密的芯片。
“我们评估从7nm、5nm,到3nm等不同工艺节点的收益时发现,从7nm到5nm的生产工艺提升所带来的收益不像以前从28nm到14nm一样,能够带来百分之几十的收益,而是降到了20%。这时候我们可以通过别的手段和方法获得同样的收益。”
通过3D堆叠的方式,Bow IPU的两个Die增加了晶体管的数量,其中一个Die(Colossus Die)和上一代一样,另一个Die主要用于提高跨Colossus Die的电源功率传输,优化Colossus Die的操作节点,从而转化为有效的时钟加速。
在同台积电的合作方面,卢涛告诉雷峰网(公众号:雷峰网),Graphcore在一年之前就同台积电合作了一颗测试芯片,与台积电的关系非常紧密,加上AI处理器本身规模较大,需要一些新技术支持落地,而从台积电的角度而言,新的技术也需要有需求的产品共同推进。
值得一提的是,虽然封装方式有所变化,但Bow IPU开箱即用,与前一代产品百分之百软件兼容,不用修改任何代码,老用户无需做任何软件适配工作就能获得性能提升,价格保持不变。
目前,美国国家实验室Pacific Northwest已经基于Bow IPU尝试做一些基于Transformer的模型以及图神经网络,面向计算化学和网络安全方面的应用,且给出了比较正面的反馈。
延续3D封装,开发超越人脑的超级智能机器
Bow IPU使用3D封装只是起点,面向未来,Graphcore正在开发一款可以用来超越人脑处理的超级智能机器。
Graphcore将这款正在研发的产品命名为Good Computer,一方面希望计算机能够为这个世界带来正面的影响,另一方面致敬著名计算机科学家Good。
基于3D WoW,预计未来Good Computer将包含8192个IPU,提供超过10 Exa-Flops的AI算力,实现4 PB的存储,可以助力超过500万亿参数规模的人工智能模型的开发。
取决于不同的配置,Good Computer价格将在100万美元到1.5亿美元之间。
卢涛表示,开发Good Computer还是会沿用IPU的体系结构,IPU的存储是在处理器里面,虽然不叫类脑、内存计算或存算一体,但从某种程度上而言,IPU的运作机理接近大脑计算的工作原理,只是把计算和存储相结合。
另外,Graphcore也将从软件方面更有效支持稀疏化以达到类脑的计算量。
雷峰网
相关文章:
不是GPU的IPU,为什么更值得英伟达警惕?
超越全球最大7nm芯片A100!Graphcore第二代IPU晶体管数量高达594亿个
直击CPU、GPU弱项!第三类AI处理器IPU正在崛起
相关文章
- 小芯片终于迎来统一标准:英特尔、台积电等巨头共同坐镇
- 爱立信被曝向恐怖组织缴纳过路费,市值暴跌900亿,多名员工已被开除
- 百度竞价和正常SEO搜索排名到底有没有影响?
- 居家办公,何必“扛主机”?
- 虚拟世界「快递系统」再升级,IPv6+是个啥? | MWC 2022
- 全国政协委员、佳都科技集团董事长刘伟:始终保持前瞻性,为科技创新发展建言献策
- 旗舰新机扎堆发布,为何它们都选择了骁龙8?
- 网传快手员工因举报领导被辞退;腾讯音乐CEO喊话员工:大家不要去字节了,在腾讯挺好;苹果3月9日举办春季发布会|雷峰早报
- 斥资6500万欧元,Netflix或将收购一家游戏厂商
- 京东收购德邦后,外部收入将会提升,亏损是否能迎来逆转?
猜你喜欢
云天励飞荣获吴文俊人工智能科技进步一等奖
业界7月16日上午,我国智能科学技术最高奖“吴文俊人工智能科学技术奖”颁奖盛典在北京隆重举行,66个获奖项目及个人受到表彰奖励。云天励飞荣获人工智能科技进步一等奖。值得一提的是,这是云天励飞第三次获得“吴文俊奖”。 图:云天励飞首席科学家王孝宇(右二)登台领奖...
阅读更多最新免费ssr节点-v2ray节点链接分享-24小时更新(2022/7/8)
技术好文今日星期五,为大家提供最新免费ssr节点及v2ray节点链接分享,更新于2022年7月8日17点更新。需要付费节点下方推荐点击出门右拐即可,周末更新资源部分可用,免费资源不易,请大家珍惜。CC博客将持续更新可用资源,尽力更新更多好用资源给大家。再次感谢大家对C...
阅读更多腾讯Q1财报:To B的深度、广度与健康度
业界5月18日,腾讯发布2022年第一季度业绩报告,其中“金融科技及企业服务”单季收入428亿元,占总营收32%。财报指出,腾讯To B业务主动调整收入结构,放弃了部分亏损订单。同时,在视频云、网络安全等PaaS领域加大资源投入。去年此时的腾讯云与智慧事业产...
阅读更多刘海屏救星,光鉴科技发布屏下3D人脸识别方案
业界众所周知,3D结构光人脸识别需要收/发传感器之间的距离尽量大,以提高识别性能,导致iPhone屏幕上一直保持着“大刘海”,而用3D人脸识别的华为机型也有“药丸挖孔”,成为它们追求屏占比路上的最大障碍。而5月8日,光鉴科技和屏幕供应商维信诺正式发布了柔性OLE...
阅读更多Gan之父Ian Goodfellow从苹果辞职:我不想回办公室上班
人工智能图注:Ian Goodfellow作者 | 王玥编辑 | 陈彩娴据外媒The Verge 作者 Zoë Schiffer 推文爆料,苹果机器学习总监,Gan之父 Ian Goodfellow 将从苹果离职。在给员工的说明当中,Ian写道,“我坚持认为灵活办公才...
阅读更多
热门文章
- 「11月24日」2024年V2ray/Clash/SSR/Shadowrocke澳大利裔日本免费节点
- 香港VPS低至6折93元/年,全场8折,香港CN2,洛杉矶CN2 GIA,洛杉矶9929,洛杉矶CMIN2,日本大阪/东京IIJ,日本BGP,韩国BGP,英国伦敦AS9929住宅IP
- 知乎直答亮相“学术酒吧”开放麦,李开复、刘知远相聚“AI上头俱乐部”
- 低至4折,2核4GB内存VPS/GPU独服 $2.99/月起,GPU VPS/GPU专用服务器 $13/月起,物理专用服务器$29/月起,可免费试用
- 美国/香港VPS年付99元起,双核/2GB/15GB SSD/500GB流量@100Mbps带宽
- MIT 热门研究:AI 工具“带飞”科研,但也严重加速内卷
- RISC-V要成为「显性」技术,到了关键时期
- 国行 iPhone 16 相机控制也接入视觉智能了!可一键调用阶跃星辰智能助手「跃问」
- 黄仁勋亲述创业故事:两次都差点倒闭
热评文章
「11月18日」2024年V2ray/Clash/SSR/Shadowrocke泰国-新加坡免费节点
「11月24日」2024年V2ray/Clash/SSR/Shadowrocke澳大利裔日本免费节点
MIT 热门研究:AI 工具“带飞”科研,但也严重加速内卷
国行 iPhone 16 相机控制也接入视觉智能了!可一键调用阶跃星辰智能助手「跃问」
知乎直答亮相“学术酒吧”开放麦,李开复、刘知远相聚“AI上头俱乐部”
黄仁勋亲述创业故事:两次都差点倒闭
低至4折,2核4GB内存VPS/GPU独服 $2.99/月起,GPU VPS/GPU专用服务器 $13/月起,物理专用服务器$29/月起,可免费试用
RISC-V要成为「显性」技术,到了关键时期
香港VPS低至6折93元/年,全场8折,香港CN2,洛杉矶CN2 GIA,洛杉矶9929,洛杉矶CMIN2,日本大阪/东京IIJ,日本BGP,韩国BGP,英国伦敦AS9929住宅IP
英伟达SC24六大技术亮点,不止加速超算500强