“我们自诩达到了某个AGI里程碑,这简直就是无稽之谈,纯粹是玩弄基准测试。”微软CEO萨提亚·纳德拉(Satya Nadella)在参加知名科技播客主持人Dwarkesh Patel主持的播客节目Dwarkesh Podcast时,毫无保留地分享最真实的感受。
纳德拉在访谈中还明确表示,AI并非赢家通吃的市场,其真正的价值在于推动全球经济增长。他认为,AI的发展不应以技术里程碑为导向,而应以能否实现世界经济10%的增速为衡量标准。
以下为专访内容:
AI不会是赢家通吃
主持人德瓦克什: 人工智能的价值将会在哪里创造?
萨提亚·纳德拉: 这是一个很好的问题。至少以我目前的看法来看,有两个地方我可以比较有信心地说。一个是超大规模厂商会做得很好。因为根本的一点是,如果你回顾Sam和其他人描述的方式,如果智能是计算力的对数,那么谁能进行大量的计算,谁就是大赢家。
另一个有趣的事情是,如果你看看任何AI工作负载的底层,比如ChatGPT。并非每个人都对GPU方面发生的事情感到兴奋。这很好,但它是一个比率,事实上,我甚至将我的集群视为AI加速器、存储和计算的比率。而且,从规模上看,你必须扩大它。因此,世界对这种基础设施的需求将会呈指数级增长。事实上,拥有这些AI工作负载简直是天上掉馅饼,因为你知道吗?它们对更多计算能力更加渴求,不仅仅是为了训练,而且我们现在知道对于测试时间也是如此。
正如我所说,测试时间,这里有一件有趣的事情。当你想到一个AI代理时,事实证明,AI代理将呈指数级地增加计算使用量,因为你现在甚至不受仅仅一个人类调用程序的限制。而是一个人类调用程序,这些程序又调用了更多的程序。这将为计算基础设施创造巨大的需求和规模。所以我们的超大规模业务,Azure业务,我认为那是一个很大的机会。
之后,事情变得有点模糊,因为你可以说,存在一个赢者通吃的模型。我只是不这么认为,因为这是我学到的另一件事,非常擅长理解哪些是赢者通吃的市场,哪些不是,在某种程度上,是至关重要的。我记得甚至在早期我开始接触Azure时,Amazon已经拥有非常显著的领先优势,人们会来找我,投资者会来找我说,哦,游戏结束了,你永远不会成功。Amazon,它就是赢者通吃。
但是,在与Oracle和IBM以及客户端-服务器竞争之后,我知道,买家不会容忍赢者通吃。从结构上讲,超大规模永远不会是赢者通吃,因为买家很聪明。消费者市场有时可能是赢者通吃,但是任何买家是公司、企业、IT部门的地方,他们都希望有多个供应商。因此,你必须是多个供应商之一。我认为即使在模型方面也会发生这种情况。
因此,会有开源,会有一个管理者。就像在Windows上一样,我学到的一个重要教训是,如果你有一个闭源操作系统,就会有一个补充,那就是开源。因此,在某种程度上,这实际上是对所发生事情的一种制约。所以我认为在模型方面,也许存在一些闭源的东西,但肯定会有一个开源替代方案。最终,开源替代方案实际上将确保闭源的赢者通吃得到缓解。
所以这至少是我的感觉在模型方面。顺便说一句,如果这东西真的像人们说的那样强大,我们不要低估国家不会坐视不理,等待私营公司满世界乱跑。所以我并不认为这是一个赢者通吃的局面。在那之上,我认为这还是一样的老一套,也就是在消费者领域,在某些类别中,可能会有一些赢者通吃的网络效应。
毕竟,ChatGPT就是一个很好的例子。我的意思是,它就像一个大规模的消费者产品,已经获得了真正的逃逸速度。我去应用商店,我看到它总是在前五名。我说,哇,这真是令人难以置信。所以他们能够利用这种早期的优势,并将其转化为应用程序优势。因此,在消费者领域,这种情况可能会发生。在企业领域,我认为在每个类别中,都会有不同的赢家。所以这至少我是这么分析的。
主持人德瓦克什: 我有很多后续问题。我们得立刻开始讨论量子计算。
但关于模型可能被商品化的观点,也许在几十年前,有人会对云提出类似的论点,认为它本质上只是一个芯片和一个盒子。
但最终,当然,你和许多其他人发现,你们在云领域拥有惊人的利润率,并且找到了获得规模经济和增加价值的方法。
而且从根本上说,即使抛开那些术语,比如,如果你拥有了AGI,它可以帮助你制造更好的AI,现在是合成数据和强化学习。也许在未来,它会是一个自动化的AI研究员。
这似乎是巩固你优势的好方法。我很好奇你对此有什么看法,就这个想法而言……
萨提亚·纳德拉: 在这个领域领先非常重要。达到一定规模后,没有什么东西是纯粹的商品,对吧?就像你刚才说的云,每个人都说,哦,云是商品,除非当你达到规模。这就是为什么运营超大规模数据中心的专业知识至关重要。你可能会说,哦,这有什么大不了的?我也可以自己搭建服务器,对吧?事实上,在超大规模数据中心发展的早期,大多数人都认为,天哪,有这么多的主机托管商,但那些都不是很好的生意。超大规模会有什么发展前景吗?超大规模甚至存在商业价值吗?事实证明,这确实是一门真正的生意,仅仅是因为运营(比如Azure,拥有遍布60多个区域的全球计算能力)的专业知识。复制起来太难了。
我想表达的重点是,是否会只有一个赢家,或者这是一个赢者通吃的局面。你必须弄清楚这一点,因为各个领域的情况可能不同。我喜欢进入那些拥有巨大潜在市场(TAM)的领域,这样你就不必担心必须成为唯一的赢家。如果你在一个可以容纳几个赢家的大市场中,并且你是其中之一,那是最好的位置。这就是我所说的超大规模机会的含义。
在模型层面,一个关键点是,模型最终需要在某种超大规模计算平台上运行。我认为这种联系将永远存在。不仅仅是模型本身,模型需要状态。这意味着它需要存储和常规计算来在代理环境中运行这些代理。这就是我思考为什么一个人通过一个模型完成所有事情可能不会发生的原因。
主持人德瓦克什: 从超大规模数据中心运营商的角度来看,顺便说一句,作为一个超大规模数据中心运营商,你所拥有的优势也很有趣,特别是在推理时间扩展方面,如果这涉及到未来模型的训练,你可以将你的数据中心和GPU摊销,不仅用于训练,还可以再次用于推理。我想知道你认为微软和Azure属于哪种类型的超大规模数据中心?是专注于预训练方面?是提供像O3类型推理的服务?还是你们只是要托管和部署市场上现有的任何模型,而忽略其他方面?
萨提亚·纳德拉: 关于这一点,这是一个好问题。我的意思是,我们构建机群的方式,至少是我们想要构建的方式,在某种程度上是顺应摩尔定律。我认为这会像我们过去所做的一切一样,对吧?也就是你每年都会不断地更新你的机群。你在这些东西的生命周期内进行折旧,然后非常非常擅长机群的部署,这样你就可以用高利用率运行不同的任务,对吧?
所以,有时会有一些非常大的训练任务,需要高度集中的峰值计算能力,并且需要协同一致。这很好。我们应该有足够的数据中心足迹来提供这种能力。但最终,这些任务无论如何都会变得如此之大,即使是预训练规模,如果它需要继续发展下去,预训练规模在某个时候也必须跨越数据中心边界。所以,它或多或少都在那里了。
很好。一旦你开始跨越预训练数据中心边界,它与其他任何事情有什么不同呢?因此,我认为,分布式计算将仍然是分布式的。所以,构建你的机群,使其能够为大型训练任务做好准备。它为测试时计算做好准备。事实上,如果这个强化学习(RL)可行,你可能会构建一个大型模型。
然后,在那之后,会有大量的强化学习和测试。对我来说,这有点像,再次强调,更多的训练计算,因为你想要为不同的任务创建这些高度专业化的提炼模型。所以你需要这样的机群。然后是服务需求,对吧?最终,光速是恒定的。
所以你不能在德克萨斯州有一个数据中心,然后说,我要从那里为全世界提供服务。你必须根据在世界各地都部署推理机群的情况来为全世界提供服务。这就是我对我们构建真正的超大规模机群的看法。
哦,顺便说一句,我希望我的存储和计算也靠近所有这些东西,因为不仅仅是AI加速器是无状态的。我需要能够拥有的不仅仅是我的训练数据本身需要存储。然后,我希望能够多路复用多个训练作业。我希望能够拥有内存。我希望能够拥有这些代理可以执行程序的环境。这就是我思考它的方式。
世界经济将会十倍增长
主持人德瓦克什: 你最近报告说,你们来自AI的年收入是130亿美元。但如果你看看你们在这一方面的同比增长,在四年内,它将增长10倍。如果趋势持续下去,你们将拥有1300亿美元的AI收入。如果是这样,你预计我们将如何利用所有这些智能?这种工业规模的应用,会通过Office实现吗?会由你们部署,让其他人托管吗?或者你们必须拥有AGI才能获得1300亿美元的收入?它会是什么样子?
萨提亚·纳德拉: Dwarkesh,我这样看待这个问题,这是一个很好的问题,因为在某种程度上,如果你要拥有这种智能的爆炸式增长、丰富性,或者说商品化,我们首先要观察的是GDP的增长,对吧?在我谈到微软的收入会是什么样子之前,这里面只有一个制约因素,对吧?这就是我们在AGI炒作中有点超前的地方,那就是,嘿,你知道吗?让我们首先看看是否,比如说,发展起来。
我的意思是,记住,发达国家是什么样的?2%的增长,如果你调整通货膨胀,那就是零?所以在2025年,当我们坐在这里的时候,我不是一个经济学家。至少我看到这种情况,然后说,伙计,我们面临着真正的增长挑战。所以我们都必须做的第一件事是,当我们说,哦,这就像工业革命,等等。让我们拥有那种工业革命类型的增长。对我来说,这意味着10%、7%、发达国家,经通货膨胀调整后,以5%的速度增长。这才是真正的标志,对吧?
所以,它不能只是供应方面,对吧?事实上,就是这样,对吧?我认为很多人都在写关于它的文章。我很高兴他们这样做,那就是,这里的大赢家不会是科技公司。赢家将是更广泛的行业,他们将使用这种商品,顺便说一句,这种商品是丰富的。突然之间,生产力提高了,经济以更快的速度增长。当这种情况发生时,我们作为一个行业就会很好。
但对我来说,那就是关键时刻。所以,我们自己声称达到了某个AGI里程碑,对我来说这只是毫无意义的基准测试作弊。真正的基准是,世界是否以10%的速度在增长。
主持人德瓦克什: 10%。好的。所以如果世界经济以10%的速度增长,那么全球经济规模大概是100万亿美元左右。如果世界经济增长10%,那就意味着每年会产生额外的10万亿美元的价值。如果是这样的话,作为一个超大规模企业,800亿美元似乎很多。难道你不应该投入8000亿美元吗?如果你真的认为在未来几年内,我们能够以这样的速度真正地推动世界经济增长。那么,关键的瓶颈将是,你是否拥有部署这些人工智能来完成所有这些工作所需的算力?
萨提亚·纳德拉: 我觉得你说得对。所以,关键在于平衡。我觉得现在有点像,让我来打个比方,经典的供给侧思维是,“让我先建好它,然后他们自然会来。” 这是其中的一种观点。而且,你知道,毕竟我们已经这样做了。我们已经承担了足够的风险去做了。但在某个时刻,供给和需求必须匹配。
所以我认为这就是关键。这就是为什么我同时关注这两个方面。所以,我认为,如果你只是一味地鼓吹供给侧,而不真正理解如何将其转化为客户的实际价值,你就会完全脱离实际。
所以,听着,这就是为什么我关注我的推理收入。这也是我公开推理收入的原因之一。有趣的是,没多少人谈论他们的实际收入。但对我来说,我认为这很重要,它可以作为你思考这个问题的制约因素。
你当然不能说,在任何给定的时间点,它们都必须完全对称地匹配。但是,你需要有实际的证据表明,你有能力将昨天的资本投入转化为今天的需求,这样你才能再次投资,甚至可能是指数级的投资,并且知道你不会完全失衡。
主持人德瓦克什: 我想知道这两种不同的观点是否存在矛盾。因为,你看,你做得非常出色的一件事是,你很早就进行了这些投资。比如,你在2019年投资了OpenAI,甚至在Co-pilot和任何应用出现之前。
如果你看看工业革命,那些6%、10%的铁路和其他基础设施的建设,很多都不是说我们先有了车票收入,然后再去怎样。当时损失了很多钱。这是事实。
所以,如果你真的认为,这里存在将世界经济增长率提高到10倍或5倍的潜力。然后你又在想,GPT-4的收入是多少?我的意思是,如果你真的认为下一阶段有这种可能性,你不应该直接放手一搏吗?让我们投入数千亿美元的算力。
萨提亚·纳德拉: 我是说,确实有一定的概率你会成功。关键在于……我是说,这里有趣的地方在于,真正的问题是,这仅仅是……这就是为什么我认为对算力集群采取平衡的方法非常重要。
这不仅仅是构建算力,而是构建能够帮助我不仅训练下一个大型模型,而且能够服务于下一个大型模型的算力。在你做到这两点之前,你无法真正利用你的投资。所以,这不是一场单纯的构建模型的竞赛。
这是一场创造一种能够被世界使用并驱动发展的商品的竞赛。所以,你必须有一个完整的思考,而不是只考虑一件事。至少我是这么看的。顺便说一句,其中一件事是,它会被过度建设。
就像你提到的互联网泡沫时代发生的事情一样。我现在看到的是,大家已经意识到需要更多的能源和更多的算力。谢天谢地。所以,每个人都会竞相投入。事实上,我看了这些数字。不仅仅是公司在部署,各个国家也会投入资金。
我很高兴成为一个租赁方。因为,顺便说一句,我建造了很多,也租赁了很多。我很高兴我将在2027年、2028年租赁大量的算力。因为我看了账单,我说这太棒了。所有这些算力投入,唯一的结果就是价格会下降。
免责声明:投资有风险,本文并非投资建议,以上内容不应被视为任何金融产品的购买或出售要约、建议或邀请,作者或其他用户的任何相关讨论、评论或帖子也不应被视为此类内容。本文仅供一般参考,不考虑您的个人投资目标、财务状况或需求。TTM对信息的准确性和完整性不承担任何责任或保证,投资者应自行研究并在投资前寻求专业建议。