上周英伟达第四季度财报全面超出分析师预期,营收同比增长78%至393.3亿美元。其中,数据中心业务收入大涨93%至356亿美元,占公司总收入的90%以上,该业务涵盖了英伟达在人工智能计算领域占据主导地位的GPU(图形处理器)。
尽管业绩亮眼,英伟达股价仍未完全从1月27日17%的跌幅中恢复,这一跌幅是自2020年以来的最严重单日下跌。
市场当时的担忧来源于DeepSeek,大家普遍认为,这意味着AI算力的成本可以大幅降低。
黄仁勋在采访中对此反驳,他表示DeepSeek推动了推理模型的发展,而这反而会增加对AI芯片的需求。
“DeepSeek 表现太棒了!”黄仁勋说道,“它的惊艳之处在于开源了世界一流的推理模型,如今全球几乎所有AI开发者都在使用它。”
黄仁勋表示,下一代AI将需要比旧模型多100倍的计算能力,这一变化源于推理阶段的来临。
以下是黄仁勋在财报公布之后接受采访的最新对话,聪明投资者(ID:Capital-nature)精译分享给大家,值得细听。
问题1
怎么看待Blackwell的量产进展?
我们刚刚度过了一个非常出色的季度,量产进展也非常顺利。但这一切并不容易。几个月前,人们还在担心,我们是否能够成功量产像Blackwell 这样复杂的产品。
Blackwell其实并不仅仅是一块芯片,它是一个完整的系统。
这个系统重达1.5吨,包含150万个组件。
它的制造难度极大,需要协调全球350家工厂和10万名操作员共同完成。所以市场对Blackwell的量产进展有所担忧是合理的。
但如今,我们已经成功完成了量产。
另一个市场关心的问题是Hopper向Blackwell的过渡可能会带来“需求空窗期”。但现在,这一阶段已经顺利渡过。
我们本季度表现优秀,下个季度也会很好,而且Blackwell订单需求强劲。。
问题2
你在财报电话会议上提到,指引也高于市场预期。
说到需求,我今天早些时候采访了亚马逊CEO安迪·贾西(Andy Jassy),他告诉我,如果AWS现在有更多AI 计算资源可供销售,他能卖出更多。这与你在电话会议上提到的短期需求信号是一致的。
那么,从中期来看,投资者应该关注哪些信号,能够对AI算力需求的持续增长保持信心?比如数据中心的扩张、AI工厂的建设,相较于历史趋势的变化?
短期需求信号来自我们的采购订单和预测数据。除此之外,还有许多新兴的初创公司正在涌现,其中一些已经非常知名。
我不具体点名,以免遗漏任何一家,但它们真的非常优秀。这些公司利用新的AI推理能力和通用人工智能(AGI)取得了突破。
其中,一部分专注于智能体AI(agentic AI),另一部分专注于物理 AI(physical AI)。每个类别都有不少公司,而它们都需要额外的算力。
这正是安迪·贾西所提到的情况:他们急需AWS提供更多计算能力,这都是既有订单和预测数据之外的。
从中期来看,今年全球数据中心的资本支出远超去年,而去年已经是一个高投入年份。
考虑到Blackwell的推出,以及更多数据中心即将上线,我们有充分理由相信,今年依然会是一个非常强劲的增长年。
问题3
那么,从长期来看,哪些趋势最让你感到兴奋?
我们刚刚才步入推理AI时代。
以往的AI在接到问题后,会立即生成答案,但不会进行推理。现在的AI在回答问题前,会先进行思考,它可能会拆解问题、逐步推理,甚至进行自我反思,生成多个版本后选出最佳答案。
这种推理过程所需的计算量,是过去AI直接生成答案所需计算量的100 倍!
如果你认为去年计算需求已经很大,那么推理AI的发展将彻底改变这一切。
DeepSeek就是一个典型案例,包括Chat T40、Grok-3,都体现了这种趋势。这些AI 模型的计算需求,远远超过了过去的水平。
问题4
让我打断一下。有些人认为DeepSeek其实意味着计算需求会减少。毕竟,最初的报道说,它能“以更少的算力实现更多功能”。
所以你的意思是,DeepSeek的一些成果实际上是相反的——未来对计算的需求会更高?能详细解释一下吗?
AI的发展大致可以分为三个阶段。
第一阶段是预训练(pre-training),就像我们上高中一样,学习大量基础知识,比如数学、语言等。这种对人类知识的基础理解是必不可少的,这为它的下一步——后训练(post-training)奠定了基础。
在后训练阶段,AI可能会接受人类反馈,就像老师给学生讲解,我们称之为强化学习——人类反馈。
AI可能会进行练习和思维实验,就像为考试做大量模拟训练一样。这一过程可以通过强化学习——AI反馈进行,甚至可以通过强化学习——可验证奖励反馈来进行测试和实践。
换句话说,现在AI正在教AI如何成为更好的AI。
目前,大量创新都发生在后训练阶段,尤其是在这些推理模型中。而这个训练过程的计算负载,比预训练阶段可能要高出100倍。
然后,到了推理(inference)阶段,AI不再只是根据提示直接生成答案,而是要进行推理。
它会先思考如何最优地回答问题,将问题拆解为多个步骤,甚至会自我反思,生成多个版本,选出最优解再呈现给用户。因此,哪怕是推理阶段,计算需求也比ChatGPT 刚推出时高出100倍。
所以,所有这些新概念,包括强化学习、合成数据生成、推理AI等等,正在让算力需求飙升到前所未有的水平。
问题5
那我们谈谈很多投资者都在关心的性价比问题。各大云计算公司在纷纷推出自研芯片,比如亚马逊的Trainium、微软的AI芯片、谷歌的TPU……很多客户的预算有限,因此会优先考虑更便宜的替代方案,而不是购买英伟达的产品。
但与此同时,你在财报电话会议上提到了性能功耗比(performance per watt)。
如果你们的下一代产品相比市场上的其他方案,性能提升巨大,是否意味着尽管英伟达芯片的价格可能更高,但性价比实际上反而更好?
我们的产品销量这样高,恰恰因为性价比是最好的。
而性能功耗比至关重要。原因很简单,数据中心的规模是有限的。
一个数据中心的功耗可能是250兆瓦,也可能是1吉瓦,但无论数据中心规模多大,企业都希望最大化其收入。
换句话说,他们需要做到两点:
一是生成高质量的tokens(AI令牌),可卖出更高单价;
二是最大化tokens的生成速率。。
换句话说,如果你的计算性能与单位能耗效率是市场最高的,那么你帮助企业创造的收入也将是最高的。
从Hopper到Blackwell,如果你观察我们的产品路线图,你会发现,推理AI模型的 token生成速率一直在大幅提升。
问题6
我想问一下关于你们的中国业务。你在财报电话会议上提到,中国市场的收入占比已经是出口管制前的一半。随着DeepSeek的出现,一些人认为它可以绕开这些限制。
从你的角度来看,这是否能说明出口管制的有效性?
很难判断出口管制是否真正有效。我可以告诉你的是,在出口管制前,我们在中国市场的收入占比是现在的两倍。
目前,中国市场的竞争非常激烈,除了出口管制的影响,还有华为等本土企业的竞争。它们的技术水平很高,市场竞争力也很强。
但最终,软件总会找到自己的出路,这可能是最简单的理解方式。无论是超级计算机、个人电脑、手机还是游戏主机,软件总能适配目标系统并发挥最佳性能。这就是软件工程师的厉害之处——他们极具创新能力,思维灵活,能够找到解决方案。
我们的架构核心之一就是软件的灵活性,这一点非常重要。而如果从美国市场来看,当前我们可以使用的GB200,其token生成速率约为目前中国市场受管制产品的60 倍,这意味着两者之间的性能差距非常明显。
问题7
上个季度你形容Blackwell的需求“疯狂”,这次你说是“非凡”,这两个词相比,你觉得哪个更准确?
我现在对Blackwell的感觉比上个季度还要更好。原因很简单:
量产进展超预期,我们不仅按计划推进,还超额完成了目标。
团队表现极其出色,他们的执行力令人惊叹。
你可能还记得,我们在Blackwell的设计上曾遇到过一个小问题,这个问题在上个季度或更早时被发现。
我们的恢复过程非常顺利,团队的表现让我深感自豪。因此,无论是从执行层面还是市场需求层面来看,我都对当前的情况感到非常满意。
要知道,DeepSeek的表现太棒了!它的惊艳之处在于开源了世界一流的推理模型,如今全球几乎所有AI开发者都在使用它。
他们要么直接将R1整合到自己的系统中;要么通过一种称为知识蒸馏(distillation)的技术,从R1中提取精华;或者利用R1开源的技术来增强自己的AI模型,使其更加强大。
过去几个月,全球AI技术水平得到了显著提升。这让我倍感兴奋。
与此同时,对计算资源、推理时间以及测试规模化的需求正在大幅增长。这正是Grace Blackwell NVLink 72令人振奋的原因之一。
从整体来看,市场对计算能力的需求比以往更加旺盛,这一趋势让我同样感到振奋。
(转自:万博新经济观察)
免责声明:投资有风险,本文并非投资建议,以上内容不应被视为任何金融产品的购买或出售要约、建议或邀请,作者或其他用户的任何相关讨论、评论或帖子也不应被视为此类内容。本文仅供一般参考,不考虑您的个人投资目标、财务状况或需求。TTM对信息的准确性和完整性不承担任何责任或保证,投资者应自行研究并在投资前寻求专业建议。