出品 | 虎嗅科技组
作者 | 丸都山
一个月前,当Ilya在NeurIPS上宣布“预训练即将终结”时,他可能无法预料到,这番表态不仅没有让业界陷入迷茫,反而掀起了另外一场狂欢。
博通成为第一个吃到肉的公司。
就在NeurIPS开幕的前一天,12月13日,ASIC芯片巨头博通发布四季报,虽然经调整净利润33%的增长不算特别“唬人”,但CEO陈福阳关于大客户将在2027年花费600至900美元购买博通AI组件的预测,还是让这家公司在次日的股价暴涨24%,成为第9家市值突破万亿的美股公司。
而在大洋彼岸的中国,ASIC概念股也再度被拉回人们的视野,包括寒武纪、芯原股份、灿芯股份等公司成为投资者热捧的对象。
虽然A股市场素来不缺乏盲目追逐热点的案例,但这一次,国内ASIC芯片厂商确实有比较坚固的基本盘。
一位产业投资人向笔者表示,“国内头部CSP(云解决方案提供商)公司都在自研ASIC芯片,而且是每一家,他们都需要第三方芯片设计公司的帮助。”
这并不难理解。就像谷歌与博通携手打造的自研TPU一样,谷歌可以为其设计架构,但关于IP核授权和版图设计的工作,还是需要博通来完成。
但问题是,国内CSP厂商会选择国内ASIC芯片设计公司吗?
这位产业投资人认为,“产品组合、IP核库、设计复用度,还有软件生态,在这些维度上,国内ASIC厂商与博通、Marwell等巨头存在着较为明显的差距。”
而一个更加宏观的问题是,即便行业公认预训练结束,高举ASIC大旗的博通,真的能推翻“英伟达叙事”吗?
01博通的底气,从何而来?
在博通财报发布后的电话会议上,陈福阳表示,在2024财年博通AI相关的半导体总营收为122亿美元,按照博通的业务结构划分,这部分收入除ASIC芯片外,应该还包括以太网交换芯片、PHY芯片等等。
即便把122亿全部算在ASIC芯片的营收上,陈福阳的预测也是非常夸张的。如果取900亿美元的上限计算,那么未来三年,博通在ASIC芯片上的年复合增长率将达到惊人的170%。
作为对比,英伟达从2022年-2024年营收的复合增长率在110%左右。
为什么陈福阳对ASIC市场会如此乐观?
这里先说下ASIC芯片的定义。ASIC,即专用集成电路(Application Specific Integrated Circuit),是为特定用户或特定电子系统制作的集成电路。
从广义上来讲,可以理解为用户对产品的功能、成本、体积等要求进行专门设计的芯片,这个语境下,汽车上用于发动机控制的芯片都可以视为ASIC芯片。
而目前用于AI行业的ASIC芯片,主要针对人工智能相关的算法和任务进行设计,以用于加速人工智能的训练和推理过程。
听起来和GPU好像有点类似?
与后者相比,ASIC专为特定推理任务而定制,不需要像GPU那样为了适应各种不同的任务而进行频繁的配置和切换。
同时,因为ASIC芯片只包含完成特定推理任务所需的功能模块,不需要像 GPU 那样集成大量的通用功能和接口。比如在一些简单的图像识别推理应用中,ASIC芯片完全可以去掉GPU中那些用于复杂图形处理和游戏渲染的模块,从而降低芯片成本。
另外,在推理端,设计厂商会针对卷积、矩阵乘法等常见运算设计专门的电路模块,在执行推理任务时,这些模块避免了冗余计算和不必要的电路切换,使功耗大幅降低。
目前业内主流观点认为,在负责的大规模数据中心的推理任务中,使用ASIC芯片可以将功耗降低30%-70%;如果在边缘计算等简单数据场景中,ASIC芯片甚至可令功耗下降一个数量级。
值得一提的是,在去年年底,红衫曾发布过一份名为《AI in 2025:Building Blocks Firmly in Place》的报告,其中有一个观点非常有趣:
现在的Software-as-a-Service未来将转向Service-as-a-Software。在AI应用上,就是未来“按成果收费”将取代现在的按“座席收费”。
如果AI行业会如同红衫预料的那样发生改变,那么在配置相对弹性的推理端,各厂商毫无疑问地会“疯卷成本”。
在这样的背景下,ASIC芯片的意义不言自明。
02替代英伟达?为时尚早
实际上,互联网大厂对ASIC芯片的关注并不比GPU晚多少。
其中最具代表性的是谷歌。早在2015年,谷歌就开发出了第一代TPU处理器(ASIC的一个分支),虽然彼时外界对这个项目的了解并不多,但驱动AlphGo击败李世石的,就是这枚芯片。
此后8年,在博通的帮助下,谷歌TPU又迭代了6个版本。
2023年12月,多模态大模型Gemini 1.0横空出世,谷歌在I/O大会上表示这个大模型的训练和推理100%由TPU V5e和TPU V4完成。
当然,这并不代表TPU在大模型训练上也有优势,只是对于谷歌来说,并不想看到英伟达在硬件平台上“赢者通杀”。
除了谷歌外,Meta和字节跳动也在通过博通“自研”ASIC芯片,虽然后者曾官方否认过与博通的合作,但有业内人士指出,字节跳动的ASIC芯片最早在今年年底就能看到回片。
不过,在博通与这些大厂的合作中,也能看到目前ASIC芯片几个明显的短板。
首先就是,至少在现阶段,各家定制/自研的ASIC芯片还谈不上节省成本,而且开发周期漫长。
比如谷歌的TPU项目始于2015年,但真正能用于大模型训练/推理的芯片直到2022年才出现(TPU V4),虽然理论上ASIC芯片适用于特定的推理任务,功能更加简单,但实际上的设计门槛非常高。从流程上来讲,需要从最基本的系统规格定义、逻辑设计上入手。
另外,相较于英伟达的GPU,无论是博通还是Marvell,都显然缺少像CUDA那样丰富且易上手的软件生态支持,在涉及卡间互联和智算中心的搭建的问题上,也没有类似NVLink和Infini Band这样“拿来即用”的解决方案。
相较于硬件平台,英伟达在软件生态上的优势,可谓是“第二名看不到车尾灯”式的领先。
这两个因素直接导致将ASIC用于AI推理,现阶段注定只是头部CSP厂商的游戏。上述产业投资人士认为,“全世界范围内,对推理端ASIC芯片有强烈需求的云厂商,满打满算可能都不超过10家。”
更重要的一点是,对于头部CSP厂商来说,其丰富的产品矩阵注定了短时间内仍需要将更加泛用的GPU作为算力中心的核心,毕竟当新的算法或应用场景出现时,GPU可以通过软件升级来支持,而ASIC则需要重新做产品设计。
因此,短时间内以博通为代表的ASIC厂商,恐怕还无法推翻“英伟达叙事”。
03国产ASIC,乘风而起?
前文提到,国内头部CSP厂商都在做自研ASIC,这其中大概可以分为两类:
第一类是以阿里和百度为代表的“纯自研路线”,与二者相关联的平头哥和昆仑芯,均已组建ASIC研发团队,并已完成相关产品的流片及量产出货。
第二类则是以字节跳动为代表的厂商,他们与第三方芯片设计公司携手研发ASIC芯片。
这两类厂商的共同点是,出于供应链安全的考量,他们对ASIC芯片的国产替代都有不同程度的需求。
这构成了国内ASIC芯片公司最坚实的基本盘,但就目前来看,国内ASIC芯片公司还有几处明显的短板需要解决。
首当其冲的就是IP核资源的稀疏。
作为对比,博通在为谷歌打造GPU时,除了提供先进封装技术、光互连技术外,还附带了一批高性能互联IP核,涵盖高速SerDes内核、PCIe接口等。如果没有这些丰富的IP核资源,谷歌TPU的研发时间会更长。
而国内AISC厂商,有时还需要先通过博通、Marvell等公司取得IP授权,这对于作为客户的CSP厂商来说,就有点得不偿失了。
另外,博通作为一家Fabless(无晶圆厂)公司,它却可以提供除代工外的全流程服务,从最前端的规格定义到最后端的3.5D先进封装,博通均可提供成熟的解决方案。
一位业内人士向笔者表示,“现在很多人把因果倒置了,不是选择ASIC路线就能推理成本骤降,而是像博通这样的企业,其强大的in-House优势让ASIC芯片的研发成本能够降低。”
还有一个无法忽视的问题是,随着BIS新规的生效,本土ASIC芯片的可代工产能被进一步收紧。当然,随着半导体行业国产替代进程的加快,这个制约因素未来有望得到改善。
Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.