【文/觀察者網專欄作者 潘攻愚】
“即使我們競爭對手的產品免費給到客戶,我們還是比他們要便宜。”
在2024年3月份SIEPR 經濟峯會的主題演講中,英偉達CEO黃仁勳這樣回答斯坦福大學查爾斯·R·施瓦布經濟學名譽教授約翰·肖文 (John Shoven)的提問。
這一席話當時在半導體圈引起了軒然大波。競爭對手的產品免費送,居然還比英偉達的GPU貴?那豈不是對手們要大肆賠錢才能和英偉達競爭?
黃仁勳在公衆場合一貫謙遜節制,但也偶露崢嶸,那一次,他可能實在是忍受不了發問人對英偉達競爭態勢的質疑,語調有些“浪”了。他口中所謂的競爭對手,乍一看上去說的是AMD或者英特爾,但仔細品味,是說給另一個領域的競爭對手聽的,即ASIC(專用芯片)的戰場。
須知,英偉達在高性能GPU(HPC和AI加速器領域)就在全球喫掉了接近450億美元的盤子,而ASIC市場2023年滿打滿算也只有200億美元,前者的高壟斷性看起來暫時不用擔心以博通、Marvell爲代表定製化芯片對其市場份額的侵蝕。
但你要說黃仁勳不着急那肯定是假的。AI大潮的推動下,比如TPU在Google Cloud上的應用,或者亞馬遜AWS的Trainium/Inferentia讓不少公司在考慮ASIC方案。2023年就有風傳英偉達也想進入ASIC這個領域,爲美國諸多CSP(雲服務商)提供定製化服務。
OpenAI也在“背刺”英偉達?
據路透社近日報道,OpenAI正在通過開發其首款自家人工智能芯片,以減少其對英偉達芯片的需求。路透社還聲稱OpenAI將在近幾個月內確定其芯片的最終設計,並將方案交由臺積電進行流片測試。
多年以來,OpenAI一直是英偉達的大主顧之一。他們考慮非通用性GPU方案,無異於是對英偉達的一種背刺。
OpenAI的訓練和推理任務高度依賴英偉達的高性能GPU(如 A100、H100)。OpenAI在2020年的論文中曾提到,GPT-3的訓練使用了約1萬塊V100 GPU。不過,OpenAI並未公開披露其從英偉達採購的GPU具體數量,這類信息通常被視爲商業機密或涉及合作伙伴協議,因此外界難以獲得準確數據。
除了採購GPU,他們之間的合作模式還有兩點需要指出:OpenAI 深度依賴英偉達的CUDA並行計算平臺和cuDNN加速庫,以最大化GPU在深度學習任務中的性能;英偉達OpenAI還有間接合作,通過合作伙伴(如微軟Azure、亞馬遜AWS)爲OpenAI提供雲GPU資源,支持其彈性計算需求。
英偉達首個DGX H200給到OpenAI
OpenAI在思考用更專用硬件ASIC的可能,步微軟Maia AI芯片和谷歌TPU的後塵,主要也是苦英偉達久矣。
英偉達通用高端GPU不僅價格昂貴,而且功耗極高,且有很強的定價權,損傷了OpenAI的“自尊心”和財務毛利率,而且某種程度上削弱了其振臂一呼搞“星際之門”的話語權和領導權。
OpenAI敢邁出這一步,也是看到了商用實地落地的可能性——踩着谷歌TPU的轅輻前進。
TPU是谷歌專門爲機器學習(尤其是神經網絡訓練和推理)而設計的ASIC,從硬件到軟件全棧優化,避免了GPU的通用計算冗餘。
谷歌單芯片TPU v4的FP16性能約275 TFLOPS,而英偉達H100的FP16算力爲400 TFLOPS,看起來差距巨大,但TPU v4可以用“打羣架”的方式避免單打獨鬥的劣勢,而且,TPU的專用推理硬件在低延遲場景中表現更優。
雖然英偉達高端GPU也需要HBM,但TPU採用的HBM高帶寬內存與計算單元緊密耦合,減少數據搬運開銷,英偉達GPU需通過顯存管理優化才能避免瓶頸。
另外還有很重要的一點,就呼應到了本文開頭的話題:成本。
在谷歌雲平臺,TPU的按需計費成本可能低於同等算力的GPU實例,尤其對長期訓練任務或批量推理更具性價比。TPU作爲託管服務,用戶無需關注底層硬件運維,而自建GPU集羣需投入更多運維資源。
這一切,加速了OpenAI與英偉達軟脫鉤的念想,雙方有了某種程度上的離心力。
儘管如此,採用ASIC方案的侷限性依然十分明顯,TPU綁定了特定框架(TensorFlow/JAX),而GPU支持更廣泛的開源工具和私有化部署,而且,ASIC一旦流片無法修改,而GPU可通過架構升級和軟件優化適應新需求。
英偉達GPU的“專用特性”
黃仁勳在業界以危機感嗅覺著稱,他的名言“要時刻爲企業一個月內破產做好準備”享譽全球,他不斷督促自己洞察一切可能的挑戰和危機。
ASIC的衝擊,他也洞若觀火。
在最近這兩代(Grace Hopper和Blackwell)的AI加速器中,他其實已經用了“通用+專用”的混合架構。他明白,AI訓練/推理、科學計算等場景對算力需求爆炸式增長,通用架構難以滿足能效和性能要求。專用硬件可顯著降低大模型訓練成本(如Blackwell的FP4/FP6支持稀疏計算)。
國內某知名GPU圖形渲染供應商市場主管告訴心智觀察所,通用芯片性能提升趨緩,通過領域專用架構(DSA)實現差異化會成爲必然選擇。
Grace Hopper和Blackwell正在不斷增加專用硬件單元,比如針對深度學習矩陣運算優化(FP16/FP8精度、稀疏計算)的Tensor Core專用於光線追蹤的硬件加速的RT Core,針對大規模AI集羣做了通信優化(如Grace Hopper的芯片間互連),Blackwell架構還直接面向大語言模型(LLM)做了硬件加速Transformer引擎。
這一切的一切都說明英偉達看到了谷歌TPU、亞馬遜Trainium等專用AI芯片的威脅,迫使英偉達通過專用化鞏固技術壁壘。
仍然需要指出的是,英偉達的高端GPU確實在向領域專用架構(DSA)演進,但其本質仍是以通用性爲基礎、通過專用模塊提升關鍵場景效率的混合模式,與ASIC的完全固化設計有本質區別。
製造端,英偉達的另一個隱祕的“護城河”
業界喜歡談英偉達的護城河,CUDA開發者平臺是其中之一,老生常談之外,還有他們和臺積電的聯盟屬性不可不察。
OpenAI曾經和Meta展開GPU的軍備競賽,總裁Altman不惜屈尊去遊說臺積電的張忠謀,讓臺積電大肆斥千億美元在美國本土擴建晶圓廠配合英偉達擴建,在半導體圈曾一度被傳爲笑談。這也說明,芯片光設計出來沒用,需要造出來才能用——代工廠的地位不可低估,甚至他們經常扮演產業鏈的核心角色。
英偉達的高端GPU,如Hopper架構的H100、Blackwell架構的B200長期依賴臺積電的先進製程工藝(如7nm、5nm、4nm及更先進節點),以實現更高性能、更低功耗。臺積電爲英偉達提供工藝定製服務,例如在4N工藝中優化了高頻性能和功耗。
臺積電投桃報李,將英偉達列爲關鍵客戶,在先進製程(如4nm)和封裝產能上優先分配,應對AI芯片的爆發式需求。受地緣政治影響,雙方合作擴展至臺積電美國亞利桑那工廠(Fab 21),計劃未來部分生產轉移至美國本土。
英偉達不但在新架構設計階段即與臺積電合作,驗證工藝可行性,而且雙方合作定義Chiplet互聯標準(如NVLink-C2C),推動異構計算生態。英偉達與臺積電的合作通過製程迭代、封裝創新和供應鏈協同,共同定義了AI芯片的性能天花板。這種合作不僅推動技術進步,更重塑了全球半導體產業鏈的競爭格局。
這恰恰就是英偉達一個隱祕的“護城河”,那就是他們和臺積電保持着緊密的合作關係,而競爭對手則未必。
爲什麼臺積電這樣的頂級代工廠喜歡英偉達的通用GPU,而相對不那麼喜歡製造ASIC?
GPU(尤其是AI/高性能計算GPU)市場需求量大且穩定,客戶如英偉達、AMD等頭部廠商的訂單規模龐大,代工廠可通過規模效應顯著降低成本。而ASIC通常爲特定客戶定製,需求碎片化且單次訂單量小,難以形成規模經濟。
GPU迭代週期較長,代工廠可長期維持同一製程的生產優化;而ASIC可能因客戶業務調整快速過時,導致產能浪費。ASIC需要代工廠投入大量資源進行定製化設計、掩膜版製作和測試,但客戶可能因項目失敗或需求變化取消訂單,導致NRE(非重複性工程)成本難以回收。相比之下,GPU的NRE費用由大客戶承擔,且訂單確定性更高。
因此,代工廠通用GPU的長期穩定訂單可爲代工廠提供更高的毛利率(尤其是先進製程節點),而ASIC項目通常需價格談判,利潤率較低。
黃仁勳深知,牢牢抓住臺積電,就抓住了最深的那條“護城河”。
DeepSeek崛起,英偉達帝國的裂縫越來越大
DeepSeek-V3火爆之後,該公司公開論文中的更多細節逐漸被人挖掘出來。
韓國未來資產證券的分析稱,V3的硬件效率之所以能比Meta等高出10倍,可以總結爲“他們從頭開始重建了一切”——用英偉達的PTX(Parallel Thread Execution)語言實現的,而不是CUDA。PTX在接近彙編語言的層級運行,允許進行細粒度的優化,如寄存器分配和Thread/Warp級別的調整。
短期內,CUDA的統治地位雖然難以被撼動,但DeepSeek的PTX可能在特定市場(如政策驅動的國產化替代、輕量級AI推理)或技術路徑(如開源生態、跨硬件支持)中開闢細分賽道。
長遠來看,其影響力取決於能否構建差異化價值,並突破英偉達的軟硬件協同壁壘。
英偉達製造端的“護城河”始於歷史演進,也必將符合歷史進程的辯證法。
英偉達和臺積電這兩家過去20多年是兩株根系交纏的常青藤,但這不意味着那些被信任澆灌的藤蔓不會褪色,在AI模型從訓練到推理應用大規模遷移的微妙時刻,裂痕像午夜窗欞的冰花,在月光下折射出鋒利的棱角,契約書上的墨跡突然開始遊動,每個標點都在宣紙背面長出鋸齒。
裂紋在出現。
最致命的那道裂紋往往開始於心臟背面,在硬科技行業中我們已經見證了太多,諸如格芯和IBM,英特爾和諾基亞......當猜忌的孢子乘着沉默的風,在曾經透明的默契裏悄然着陸——直到某天整座瓷器轟然崩解,我們纔看清每塊碎片裏都凍着未曾啓齒的疑雲。
本文系觀察者網獨家稿件,文章內容純屬作者個人觀點,不代表平臺觀點,未經授權,不得轉載,否則將追究法律責任。關注觀察者網微信guanchacn,每日閱讀趣味文章。