作者 | Shot_Caller
编译 | 华尔街大事件
就收入而言, AMD( NASDAQ: AMD ) 的规模约为英伟达的五分之一。然而,随着人工智能市场的扩大,AMD 有可能从英伟达手中夺走市场份额。但分析师怀疑 AMD 的努力是否为时已晚,因为有迹象表明对人工智能计算的需求可能会放缓。即使 AMD 能够匹敌 Nvidia 的技术堆栈,考虑到 英伟达已经拥有的开发者心智份额,该公司可能也来不及保持竞争力了。
人工智能市场正在经历明显的放缓。由于需求低迷和供应增加,H100 价格暴跌。随着模型和服务于它们的软件变得更加高效,并利用曾经闲置的 GPU 容量的更高百分比,计算价格自然会下降。价格下跌的长期趋势意味着终端客户不太愿意签订多年合同,而是依赖现货或按需定价。
英伟达的股价也因盈利消息而明显低迷。DeepSeek显示出开源模型与闭源模型一样具有竞争力的潜力,其股价因此下跌。
我们的理解是,这表明开源模型和闭源模型之间的差距正在不断缩小,从 3 年缩短到大约 18 个月或更短。这意味着顶级 AI 公司的交付周期并不长,他们继续为最新模型收取更高价格的能力将不可持续。这将导致 AI 竞赛最终放缓,从而减少对顶级 Nvidia 芯片的需求,消除瓶颈,并压低镐和铲玩家可以收取的价格。再加上 AMD、Apple 和超大规模芯片(如亚马逊 ( AMZN ) 的 Trainium 和 Inferentia)作为替代计算平台的不断扩大的存在,前景变得更加严峻。(来源:作者在 CoreWeave 上的文章。)
英伟达的股价明显缺乏过去所经历的“上涨”,上一次上涨是在 2024 年 5 月。
2022 年 11 月,随着 ChatGPT 的发布,人工智能热潮开始兴起。我们已经进入热潮约 2.5 年,但 AMD 尚未在人工智能领域取得成就。人工智能领域的整体市场正在失去动力。
这并不是说人工智能革命已经结束。一些特定的用例正在兴起,例如具有编码功能的 Cursor。
但值得注意的是,编码一直是一种众所周知的低调用例,就像 Github Co-pilot 所见的那样。客户服务和聊天机器人等企业用例也是如此,它们使用大型语言模型或 LLM、评估/监控工具和 RAG 的组合。我们这些用例会越来越好,但尽管大量风险投资投入到人工智能领域,我们还是很难看到新的用例出现。
PitchBook 数据显示,去年,人工智能和机器学习初创公司的融资占全球所有风险投资交易价值的 35.7%。在北美,该垂直行业几乎占据了所有风险投资资金的一半。在全球范围内,对人工智能和机器学习初创公司的投资增长了 50% 以上,达到 1315 亿美元。(来源:Pitchbook。)
大部分私人资本都投入了过于狭窄的领域,例如机械可解释性、模型路由和基于算法的硬件加速。人工智能最初的战争迷雾使得来自大学的学术研究看起来具有巨大的上升空间。但我们开始看到更大的参与者悄悄进入初创公司的这些技术创新,例如AWS 的模型路由器和Alexa 的消费者代理。资金充足的初创公司(如 Cursor)也在实施缓存和推测解码等狭隘的解决方案,并根据自己的需求进行修改,因为这些技术的原始开发者意识到他们的护城河微不足道,很容易被更大、资金更充足的参与者蚕食。
但核心问题是,随着这些专注于特定领域的初创公司开始倒闭,它们对强大 GPU 的需求将开始减弱,从而影响整体需求。此外,超大规模企业为了降低成本,正在创建专门针对其自身工作负载的定制芯片。这些因素结合起来,为 AMD 描绘了一个艰难的未来。推动人工智能热潮的心理在硅谷开始消退,我们预计这将开始迅速蔓延到公开市场。
AMD 有一个软件工具,允许在英伟达的 CUDA 和 AMD 的 ROCm 之间移植模型。移植很容易,但优化却很难。就像钢琴家弹吉他一样,模型可能能够运行,但它无法最大限度地发挥 AMD GPU 的独特优势,例如其 HBM 容量、带宽以及 AMD MI300x 与英伟达 H100 相比几乎高出 3 倍的流式多处理器。
问题在于,大多数基于 AMD 的公司必须投入大量精力才能有效运行 AMD GPU。预计会进行一定程度的自定义优化,尤其是因为不同的初创公司(基础模型提供商与垂直化参与者)使用不同的模型(音频与图像),具有不同的优先级要求(每秒令牌数与第一个令牌的时间)。但是,当需要进行过度优化时,这就会成为一个问题,这会导致公司不愿意分享他们的学习和实施。
英伟达解决了这个问题,因为有大量的开发人员愿意免费为他们的软件堆栈做出贡献,例如斯坦福大学的 Flash Attention 和加州大学伯克利分校的 vLLM。AMD 目前缺乏这样的开发者社区,这给了 Nvidia 一个关键的竞争优势,并迫使使用 AMD 硬件的开发人员投入更多资源来实现类似的性能。
鉴于英伟达不会坐以待毙,AMD 将会面临一场艰苦的战斗。英伟达仍然具有显著的规模经济和转换成本,这使得 AMD 几乎不可能有效竞争。
AMD 是一家健康的公司。自 2020 年代初大举收购以来,他们的财务状况一直在稳步改善。通过过去几年收购 Xilinx 和 Pensado 等公司,AMD 在 FPGA 和 DPU 中找到了新的收入来源。合并后的整合似乎进展顺利,利润率也在提高。然而,由于开发人员的注意力延迟以及人工智能市场的放缓,该公司预期的主要收入来源正显示出疲软迹象。CoreWeave 的低迷 IPO 很好地预示了人工智能领域参与者的命运。
Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.