黄仁勋的最新野心,已经是AGI时代大一统

观网财经
07 Jan

“请问有椅子可以让我坐一会儿吗?”

手持一块硕大“盾牌”,摆出美国队长的pose之后,年过六旬的英伟达创始人黄仁勋似乎有些体力不支了。

当地时间1月6日晚,黄仁勋在拉斯维加斯的CES 2025上带来开幕演讲。性能翻倍的5090、性能与4090相当却只卖三分之一价格的5070……英伟达新一代显卡的发布足以让游戏玩家兴奋,不过跟这个耗尽老黄体力的大家伙相比,就是小巫见大巫了——

这就是巨型芯片系统NVLink72。

黄仁勋手里的“盾牌”,其实只是NVLink72的缩小模型。真正的NVLink72由72块Blackwell GPU构成,整体重量达到1.5吨,据称算力超过世界上最大、最快的超级计算机。

黄仁勋的目标,是满足世界上所有数据中心的算力需求。

这应该不仅仅指现有的算力需求,黄仁勋还想要创造更多的需求。在演讲中,黄仁勋还正式介绍了其世界基础模型NVIDIA Cosmos和语言基础模型NVIDIA Llama Nemotron。作为一个物理模型,Cosmos能够生成海量仿真物理数据,帮助自动驾驶和机器人企业训练自己的算法。

并且,Cosmos是一个开源模型。作为算力基础设施提供者的英伟达,正试图把模型也变成标准化的基础设施,而使用模型的企业也会与英伟达算力深度绑定。

黄仁勋的目光,已经投向AGI时代的大一统。

“满足全球数据中心需求”

早在去年,英伟达就发布过Blackwell架构的超级芯片系统GB200,由两颗B200 GPU、一颗Grace CPU构成。这个思路简单来说,就是一块芯片做不到的事,就把两块芯片叠加起来。

此次发布的NVLink36和NVLink72更是把这个思路发挥到极致。

NVLink72包含72个Blackwell GPU,144个芯片,总共有130万亿个晶体管,2592个CPU核心,并以HBM内存相连。

黄仁勋表示,一个NVLink72芯片的的AI浮点运算性能是1.4exaflops,比世界上最大、最快的超级计算机还要大。

除了算力巨大,Blackwell架构的芯片与上一代相比,每瓦性能提高了四倍,每美元性能提高了三倍。

黄仁勋指出,目前大模型的token生成速度为每秒20到30个,与人类阅读速度相当。但未来,GPT-O1、O3和Gemini Pro等新模型能够进行自我对话和反思,因此token的生成速度将大幅提高,因此必须大幅降低算力成本,才能让数据中心盈利,也就是创建NVLink的原因。

黄仁勋表示,Blackwell目前已在45家工厂全面投产,由约15家计算机制造商提供200多种不同配置的系统,采用液冷、风冷等多种冷却方式,并支持多种CPU和NVLink配置,以满足全球数据中心的需求。

“机器人的ChatGPT时刻”

英伟达另一个意义重大的发布是Cosmos。

Cosmos的含义是“宇宙”,体现出英伟达对这个世界模型寄予的极大期望。

其实去年年中,Cosmos项目就已经引起外界注意。为了获取现实世界数据,据说英伟达从YouTube及其他视频平台大规模下载视频内容作为训练数据喂给Cosmos,引发了一些版权争议。谷歌和Netflix公开声明,禁止任何未经授权的内容抓取行为。

Cosmos究竟扒了多少数据?这次黄仁勋给出了答案——2000万小时的视频训练。

黄仁勋介绍,Cosmos优先考虑了自动驾驶和机器人行业的需求,开发者可以使用NVIDIA Omniverse构建基于物理的、地理空间精确的场景,然后将Omniverse渲染输出到Cosmos,后者生成逼真的、基于物理的合成数据,涵盖不同的物体、环境以及天气、时间或极端情况等条件。

相较于语言模型可以使用全网语料训练,自动驾驶和机器人的训练需要来自真实世界的训练素材,获取成本高昂,成为具身智能发展的最大障碍。为解决真实数据难以获得的问题,很多企业都转向了使用机器生成的仿真数据进行训练。

而Cosmos有望为大量无力自己生产仿真数据的企业,提供一个廉价方案。

作为自动驾驶领军者的特斯拉,会不会感受到巨大的威胁?

X平台知名博主Sawyer Merritt对此评论说,Cosmos看上去是为传统汽车制造商准备的,它们的现实世界数据收集几乎为零,落后特斯拉多年,合成数据有望解决这一问题,但未必能完全解决,因为合成驾驶数据有点像使用 ChatGPT,数据质量未必完全可靠。

马斯克转发了这条博文,并评论说——正确(correct)。

但黄仁勋已经发出了宣言:希望开源的Cosmos能像LLAMA 3改变企业AI一样,改变机器人和工业AI领域,通用机器人即将迎来“ChatGPT时刻”。

除了秀技术之外,黄仁勋演讲中的另一个重要部分,是展示自己的朋友圈。

在介绍Cosmos模型时,黄仁勋在台上一口气请出了14台不同品牌的机器人产品,其中6台来自中国,分别是宇树、智元、星动纪元、银河通用、傅利叶和小鹏的产品。

比亚迪、理想、小米、极氪等中国新能源车企,将搭载英伟达下一代智能驾驶芯片Thor。丰田则将与英伟达合作开发下一代自动驾驶汽车。

成熟的开发生态,一向是英伟达除了硬件之外同样重要的护城河。通过开源Cosmos和 Llama Nemotron两个模型,无论英伟达能否真正威胁到特斯拉和OpenAI的领先地位,它都有助于“技术平权”,让更多企业快速进入AI领域,从而极大扩展自己的用户规模。

借助强悍的硬件性能和面向物理世界的开源基础设施,英伟达的野心不言而喻——要在AGI时代继续强化自己的算力垄断。

责任编辑:十八

Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.

Most Discussed

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10