您现在的位置是：首页 > 芯片芯片

AI的「iPhone时刻」后，英伟达打开生成式模型「魔盒」

cc博主2023-03-22【芯片】352人已围观

在人工智能应用“淘金潮”的火热背后，总少不了“卖水工”英伟达的“默默付出”。

最近爆红的ChatGPT也离不逃脱不开这一定律。正如英伟达CEO黄仁勋在GTC演讲中展示的那样，数年以前，正是黄仁勋亲手将附有自己签名与赠语的全球首台DGX交给了OpenAI。

AI的「iPhone时刻」后，英伟达打开生成式模型「魔盒」第1张

正因为这台集成了八块通过NVLink共享算力的H100组成的超级计算机，OpenAI才获得了向世界交出这份名为ChatGPT答卷的机会。

在英伟达向OpenAI交付首台DGX AI电脑后，位列《财富》100强的企业中有一半都使用了DGX AI计算机。英伟达的算力基础设备与人工智能应用，俨然已经成为了一枚硬币不可分割的正反面。

在刚刚结束的英伟达GTC 2023上，英伟达向我们展示了他们向人工智能的未来迈出的下一步。

人工智能的“iPhone时刻”

如今，生成式AI和大语言模型带来的杀手级应用在全球的火热，又让人工智能站到了一个新的路口前，如黄仁勋在GTC 2023的演讲中所说的一样，人工智能现在等来了属于自己的“iPhone时刻”。

而作为AI硬币另一面，英伟达也正随AI一同前行。

黄仁勋预测，就像iPhone带来智能手机和应用程序的普及一样，能生成自然文章和图像的“生成式AI”将在社会普及。

“算力即权力”这句口号正以人们未曾预料到的速度变为现实，但对于企业和开发者来说，想获得这样的“权力”并没有那么容易。

新生的初创公司竞相构建从未有过的产品的商业模式，老牌公司也在积极拥抱变化，应对新的环境。

而大模型的训练需要数据中心成百上千的计算卡“齐心协力”，对企业来说，这代表着场地和维护成本，是一道并不容易越过的门槛。

不论是新生血液还是老牌豪强，都呼唤更快捷的人工智能开发流程。

作为“算力供应商”的英伟达已经发觉了这一新需求，并推出了云端人工智能DGX Cloud。

DGX Cloud能够为客户提供专用的计算集群，每个DGX Cloud实例配备八个NVIDIA H100或A100 80GB Tensor Core GPU共640GB的GPU内存，用户能够按月租用这些计算资源，并使用简单的web浏览器访问。从而消除在本地获取、部署和管理基础设施的成本，大大增加了AI的便捷性。

对于这一产品的远景，黄仁勋充满憧憬的描绘到：“如今通过一个浏览器，就能将DGX AI超级计算机即时地接入每家公司。”

这样的愿景并非空中楼阁，在GTC 2023的演讲中，黄仁勋宣布，英伟达将与云服务提供商合作托管DGX云基础设施，目前已经于甲骨文达成了合作，甲骨文的OCI RDMA Supercluster已经提供了一个可扩展到超过32000个GPU的超级集群。微软Azure预计下个季度开始托管DGX Cloud，很快谷歌云也将加入托管的行列。

打开生成式AI的“魔盒”

iPhone问世之后，并没有止步不前，而是引领了智能手机长达数十年的大发展。如今走到“iPhone时刻”的AI，面对的也是一个与当年的iPhone极其相似的世界。

ChatGPT的成功，对AI的革命而言，仅仅是踏进门口的一小步。

门后的世界中，还蕴藏着属于生成式AI更广阔的世界。

在基础设施之外，对想要掌握AI“原力”的企业来说，如何搭上AI的下一班车，建立一个生成式AI模型，并将其应用到生产中，也将是一个重要命题。

英伟达发布的新云服务平台NVIDIA AI Foundations则是让企业做到这一点的“神兵利器”。

NVIDIA AI Foundations被分为用于构建定制的语言文本模型的Nemo、提供视觉语言制作服务的Picasso和提供医学相关数据专有模型构建服务的Bionemo三个而部分。

AI的「iPhone时刻」后，英伟达打开生成式模型「魔盒」第2张