性能暴增150%的地表最強AI芯片發佈,英偉達捍衞算力“霸主”,英特爾前CEO也來助威|鈦媒體AGI

鈦媒體AGI
03-19

老黃會前穿着“外賣”圍裙送漢堡(圖片來源:視頻截圖)

老黃再度帶領 AI 芯片等新品“炸場”。

北京時間3月19日凌晨,“AI超級碗”GTC大會上,英偉達創始人兼CEO黃仁勳向全球推出最強AI芯片GB300,個人AI超級計算機DGX Spark,並預告新一代芯片Vera Rubin等新品。

其中,GB300基於全新Blackwell Ultra架構,和去年發佈的GB200相比,性能提升1.5倍,新的注意力機制(New Attention instructions)提升2倍,擁有20TB HBM高帶寬存儲提升1.5倍,預計將在今年下半年出貨

英偉達表示,基於GB300的英偉達GB300 NVL72 機架級解決方案的 AI 性能比 GB200 NVL72 高出 1.5 倍,與使用英偉達Hopper構建的工廠相比使Blackwell的AI工廠收入機會增加50倍。

同時,與Hopper一代相比,NVIDIA HGX B300 NVL16 在大型語言模型上的推理速度提高11倍,計算能力提高7倍,內存增加4倍,從而爲 AI 推理等最複雜的工作負載提供突破性能。首批當中,預計思科戴爾、聯想、超微電腦、華碩、富士康等提供基於Blackwell Ultra服務器,AWS、谷歌雲、微軟雲、甲骨文雲等雲廠商將首批提供Blackwell Ultra支持實例。

Vera Rubin方面,與Grace Blackwell(GB)類似,Vera是CPU,Rubin是GPU,而Vera Rubin整體性能是GB300的3.3倍,CPU內存容量是Grace的4.2倍,內存帶寬是Grace的2.4倍,預計將於2026年下半年量產出貨;此外,黃仁勳還預覽了下一代AI超級芯片Rubin Ultra,內存帶寬是前代的8倍,性能是GB300的14倍;Rubin下一代GPU架構則是Feynman。

黃仁勳表示:“AI已經取得了巨大的飛躍——推理和Agentic AI需要更高數量的計算性能。我們爲這一刻設計了 Blackwell Ultra——它是一個單一的多功能平臺,可以輕鬆高效地進行預訓練、後訓練和推理 AI 能力。”

據黃仁勳透露,今年,微軟、谷歌、亞馬遜和Meta四家大型雲服務商已經購入360萬顆Blackwell芯片,預計2028年數據中心資本支出規模突破1萬億美元。

事實上,當前對於華爾街來說,這場演講也可以看作是黃仁勳的“股價保衛戰”。

隨着中國開源 AI 模型DeepSeek風靡全球,儘管黃仁勳坦言當前AI模型所需的算力是此前模型的100倍,帶動算力需求增加的關鍵是AI推理,但資本市場質疑 AI 算力需求減弱,英偉達年內股價已下跌超10%。

隨着下一代Rubin Ultra架構最強 AI 芯片揭開面紗,雖然當日英偉達股價沒能重回巔峯,18日收盤時下跌3.43%,但CNBC表示,黃仁勳已經推動英偉達開始從數據中心轉型,預測未來幾年,就AI革命而言,英偉達仍然發揮着真正的作用,而不是躺在“功勞簿”上。

“我們現在必須以10倍的速度計算,我們要做的計算量要是當前的十倍、一百倍。”黃仁勳稱,10年間,AI從感知和計算機視覺發展到生成式AI,現在又發展到具有推理能力的Agentic AI。如今,AI理解上下文,理解我們在問什麼,現在它生成的答案,從根本上改變了計算的方式,而大規模推理是一種極限計算。

黃仁勳強調,下一波 AI 浪潮已經到來:機器人技術。

四大業務重新組合,個人超算每秒運算1000萬億次

英偉達主要有四個營收來源:數據中心、遊戲、專業可視化、汽車,後兩者目前佔比較小,營收貢獻主要依賴於數據中心業務和遊戲業務。

因此,GTC大會上,黃仁勳演講也是圍繞五個板塊順序介紹——RTX消費級顯卡、汽車、GB系列數據中心AI芯片、CUDA和可視化等軟件、以及最後的機器人技術。

首先是消費級顯卡,黃仁勳表示,基於BlackWell架構的RTX5090已經快賣沒了,與4090比較,體積小了30%,消耗能量方面提高了30%,性能令人難以置信,是因爲 AI 取得了非凡的進步,給世界計算機圖形帶來了革命性的變化。因此,英偉達推出新一代工作站和服務器GPUNVIDIA RTX PRO Blackwell系列,專爲複雜的AI驅動工作負載、技術計算和高性能圖形而打造,而ChatRTX 更新現已支持 NVIDIA NIM,RTX Remix推出測試版。英偉達強調,NVIDIA RTX PRO 6000 Blackwell 是醫療保健、製造業、零售業、直播和其他行業中 AI 和視覺計算工作負載的終極通用 GPU。

同時,今年1月,CES上黃仁勳發佈全球最小的個人AI超級計算機Project Digits,如今則被命名爲DGX Spark,大小和Mac Mini4相當,它內置英偉達GB10芯片,能夠提供每秒1000萬億次的AI運算,用於微調和推理最新AI模型,採用NVLink-C2C互連技術,內存帶寬是第五代PCIe的5倍。該產品售價3000美元(約合人民幣21685元)。

值得注意的是,英偉達還公佈了下一代個人超級電腦DGX Station,稱是人工智能和數據科學的終極工作站,擁有GB300 Superchip 784GB統一系統內存,高達20000 AI TFLOPS計算能力。

其次是汽車,英偉達推出 NVIDIA Halos,這是一款適用於自動駕駛汽車的全棧綜合安全系統,將英偉達的汽車硬件和軟件安全解決方案系列與其在自動駕駛安全領域的尖端 AI 研究結合在一起,加速自動駕駛汽車的發展。至此,英偉達將其開發技術套件從雲端到汽車統一起來,涵蓋車輛架構到 AI 模型,包括芯片、軟件、工具和服務。此外,英偉達還宣佈,通用汽車與NVIDIA合作開發 AI,助力下一代汽車體驗和製造。

再次是GTC大會重頭戲數據中心AI芯片,英偉達發佈了一系列計算、通訊和高帶寬產品和信息。

黃仁勳表示,在使用現成的電腦後,超大規模數據中心能夠解決巨大規模的問題。然而,我們試圖解決的問題是如此複雜。而英偉達的目標是“擴大規模”,我們本質上想要建造 AI 超級芯片,只是沒有激進的技術可以做到這一點,沒有工藝技術可以做到這一點。他直言,在計算機科學和工廠中,延遲、響應、時間和吞吐量之間存在根本的緊張關係,因此,世界需要一個偉大的超級電腦。

會上,英偉達發佈了支持 AI 推理的NVIDIA Blackwell Ultra、NVIDIA橫向擴展基礎設施(通訊、網絡),以及英偉達軟件創新等。

其中,NVIDIA GB300 NVL72採用機架級設計,連接72個 Blackwell Ultra GPU和36個基於 Arm Neoverse 的NVIDIA Grace CPU,充當專爲測試時間擴展而構建的單個大型 GPU。藉助其設施,AI 模型可以訪問平臺增強的計算能力,探索問題的不同解決方案,並將複雜請求分解爲多個步驟,從而獲得更高質量的響應。此外,Blackwell Ultra 平臺還適用於:Agentic AI,使用複雜的推理和迭代規劃來自主解決複雜的多步驟問題,可以推理、規劃並採取行動來實現特定目標;Physical AI,使公司能夠實時生成合成的、逼真的視頻,以大規模訓練機器人和自動駕駛汽車等應用。

網絡和通訊層面,英偉達首次推出 Spectrum-X Photonics,同封裝光學網絡交換機,將 AI 工廠擴展至數百萬個 GPU,每端口 1.6 兆兆位/秒交換機,英偉達稱其光子交換機是世界上最先進的網絡解決方案。與傳統方法相比,它們將光學創新與 4 倍更少的激光器相結合,從而實現 3.5 倍的能效、63 倍的信號完整性、10 倍的大規模網絡彈性和 1.3 倍的部署速度。

同時,英偉達稱,藉助 GB200 和 GH200 架構的 NVLink-CNC 互連(可提供 CPU 和 GPU 內存一致性),可以在單個 GPU 上擴展內存和應用,使用 NVIDIA Warp(一種基於 Python 的加速數據生成和空間計算應用框架),Autodesk 使用八個 GH200 節點執行了多達 480 億個單元的模擬,這比使用八個H100節點進行的模擬大5倍以上。

此外,英偉達宣佈,Blackwell Ultra與NVIDIA Spectrum-X 以太網和NVIDIA Quantum-X800 InfiniBand平臺無縫集成,通過ConnectX-8 SuperNIC 爲系統中的每個 GPU 提供 800 Gb/s 的數據吞吐量。而DPU方面,擁有英偉達BlueField-3 DPU的Blackwell Ultra 系統,可支持多租戶網絡、GPU 計算彈性、加速數據訪問和實時網絡安全威脅檢測。

英偉達強調,先進的橫向擴展網絡是 AI 基礎設施的關鍵組成部分,可提供最佳性能,同時減少延遲和抖動。

軟件創新上,整個Blackwell產品組合均由全棧英偉達AI平臺支持。其中,今天推出的NVIDIA Dynamo開源推理框架,擴展了推理 AI 服務,實現了吞吐量的飛躍,同時縮短了響應時間和模型服務成本;同時,NVIDIA Dynamo 是一款新型 AI 推理服務軟件,旨在爲部署推理 AI 模型的 AI 工廠最大限度地提高token收入,確保最大程度地利用 GPU 資源。此外,NVIDIA AI Enterprise包括NVIDIA NIM 微服務,以及企業可以在 NVIDIA 加速雲、數據中心和工作站上部署的 AI 框架、庫和工具。

英偉達強調,Blackwell平臺建立在英偉達強大的開發工具生態系統、NVIDIA CUDA-X庫、超過600萬開發人員和4000多個應用之上,可在數千個GPU上擴展性能。

事實上,英偉達全場都在談及軟件對GPU和 AI 計算的影響。比如,利用NVIDIA cuDSS 加速工程求解器,用於解決涉及稀疏矩陣的大型工程模擬問題,適用於設計優化、電磁模擬工作流程等應用,利用 Grace CPU 內存和超級芯片架構,使用相同的 GPU 和 cuDSS 混合內存,可將最繁重的解決方案步驟加速高達4倍,從而進一步提高效率。

模型層面,英偉達宣佈,經過英偉達後期訓練,全新開源Llama Nemotron 推理模型爲 Agentic AI 提供業務基礎,使模型的準確率較基礎模型提升高達 20%,推理速度較其他領先的開放推理模型提升5倍,埃森哲、德勤、微軟、SAP和ServiceNow 與英偉達合作開發推理 AI 代理,以改變工作方式。此外,英偉達還宣佈與Alphabet和 Google就Agentic和Physical AI的未來展開合作。

最後是機器人。

黃仁勳宣佈,英偉達發佈全球首個開放式人形機器人基礎模型 Isaac GR00T N1,以及加速機器人開發的仿真框架。

GR00T N1基礎模型採用雙系統架構,靈感來自人類認知原理,“系統 1”是一種快速思考的行動模型,反映了人類的反應或直覺。“系統 2”是一種慢速思考的模型,用於深思熟慮、有條不紊的決策。而在視覺語言模型的支持下,系統 2 可以推理其環境和收到的指令,從而規劃行動。然後,系統 1 將這些計劃轉化爲精確、連續的機器人動作,並接受人類演示數據和NVIDIA Omniverse平臺生成的大量合成數據的訓練,因此,GR00T N1 可以輕鬆實現常見任務,例如抓取、用一隻或兩隻手臂移動物體以及將物品從一隻手臂轉移到另一隻手臂,或者執行需要長時間上下文和一般技能組合的多步驟任務。這些功能可應用於物料搬運、包裝和檢查等用例。

目前,GR00T N1已經上市,是英偉達將預先訓練併發布給全球機器人開發人員的一系列完全可定製模型中的第一個,加速了全球勞動力短缺(估計超過 5000 萬人)所帶來的行業轉型。此外,英偉達對NVIDIA GR00T N1 訓練數據和任務評估場景已經開源。而用於合成操作運動生成的 NVIDIA Isaac GR00T 藍圖現在也可以下載,而英偉達DGX Spark個人 AI 超級計算機爲開發人員提供了一個相關係統,無須大量定製編程即可擴展 GR00T N1 的功能,以適應新的機器人、任務和環境。

最後的最後,老黃在謝幕之前還成功“召喚”出了配有GR00T N1模型的機器人——Blue(星球大戰機器人)。

黃仁勳表示,“通用機器人時代已經到來。藉助 NVIDIA Isaac GR00T N1 以及新的數據生成和機器人學習框架,世界各地的機器人開發人員將開拓 AI 時代的下一個前沿。”

此外,英偉達還宣佈與 Google DeepMind 和迪士尼研究中心合作開發 Newton,這是一個開源物理引擎,可讓機器人學習如何更精確地處理複雜任務。

總結這場演講,黃仁勳提及最多的幾個關鍵詞:tokens、推理和Agentic AI。

在他看來,未來 AI 需要更多的tokens和推理能力,算力需求也會攀升,進一步加速Agentic AI和Physical AI發展,使得 AI 從虛擬世界轉向物理世界。

黃仁勳表示,BlackWell正在全力生產,客戶需求令人難以置信,因爲 AI 出現一個拐點,作爲推理的結果,AI 計算量要大得多,AI 和推理訓練,AI系統和代理AI系統;第二,Blackwell、Vera Rubin與Dynamo性能不斷提升,用於計算和推理的 AI 工廠將成爲未來十年最重要的工作負載之一。

市場對英偉達GPU供不應求,但算力“霸主”難持續

儘管ChatGPT熱潮至今已有兩年多,但全球對於 AI 算力需求依舊不減。

據統計,2024年,微軟、谷歌、亞馬遜和Meta四家大型雲服務商合計資本支出高達2283億美元,比2023年的1474億美元增長55%。預計2025年,四家大型雲服務商資本支出總額將超過3200億美元,增長超40%。

黃仁勳透露,四大雲廠商今年已採購360萬個Blackwell芯片,預計2028年數據中心資本支出規模突破1萬億美元。

“回看歷史,半導體大爆發,第一個是PC,第二個爆發是手機,第三個大爆發是AI,未來半導體最少還有10-15年來消化 AI 需求。”羣聯電子董事長潘健成對鈦媒體AGI表示。

2025年,DeepSeek重新燃起 AI 大模型產業發展新熱潮。

Omdia最新報告顯示,2023年,全球生成式 AI 市場規模佔總 AI 市場的9%,達68億美元;2024年,生成式AI市場預計增長一倍以上,達到146億美元;預計到2029年,生成式 AI 市場規模佔比達三分之一,約合73億美元,五年複合增長率達38%,市場前景廣闊。

然而,DeepSeek在架構和算法上實現了訓練推理效率提升,同時模型訓練成本也大幅下降至560萬美元。因此,行業普遍認爲,AI推理會讓英偉達GPU需求降低。今年1月,DeepSeek熱潮使得投資人拋售英偉達股票,導致其市值蒸發6000億美元。黃仁勳本人的淨資產在這場暴跌中也一度縮水近20%,如今稍有回落。

潘健成對鈦媒體AGI表示,雲端的訓練GPU可能已經達到頂峯,但推理 AI 還沒開始。意味着,市場需求已經進入GPU發展瓶頸期,英偉達算力“霸主”難以持續。

2月27日英偉達發佈的四季度財報顯示,英偉達Q4營收393.31億美元,同比增長78%;調整後毛利率爲73.5%,同比下降3.2個百分點;公認會計准則下,季度淨利潤220.91億美元,同比增長80%,環比增長14%,非GAAP下調整後同比增長72%,均低於分析師預期。

整個2025財年,英偉達營收首次突破1000億美元,達1305億美元,較上年同期增長114%;非公認會計准則下,淨利潤達742.65億美元,較上年同期增長130%;毛利率75.5%,同比上漲1.7個百分點,調整後EPS2.99美元。

其中,去年全年,英偉達中國區營收171.08億美元,爲史上最高,比前一年103.06億美元增長66%。英偉達現在的營收中,大約有53%是在美國之外。

黃仁勳表示,AI 芯片Blackwell的需求驚人,目前公司已成功實現 Blackwell AI 超級計算機的大規模生產,第一季度的銷售額就達到數十億美元。預計Blackwell Ultra將於2025年下半年發佈,一旦Blackwell完成增產,利潤將改善,重申利潤率到2025年年底爲“70%-80%區間中部”。

黃仁勳今天提供了數據中心和英偉達 AI 芯片的份額。Dell Oro預測,到2028年,全球數據中心資本支出高達1萬億美元以上,而英偉達數據中心收入將在其中發揮關鍵作用。

很顯然,黃仁勳非常有信心在數據中心方面取得更大進展。

“推理帶來的潛在需求讓人感到興奮。這將要求比大語言模型更多的計算。這可能會要求比當前多出(至少)數百萬倍的計算。”黃仁勳強調,AI 行業正以光速發展。下一波浪潮即將到來,企業的agentic AI,機器人的Physical AI),以及不同地區爲自己的生態系統構建主權 AI,每一個都剛剛離開地面。“很明顯,我們處於這一發展的中心。”

長期來看,英偉達希望構建一座基於計算基礎設施的 AI 工廠。

與傳統數據中心不同,AI 工廠不僅存儲和處理數據,它們以規模製造智能,將原始數據轉化爲實時洞察。對於全球的企業和國家來說,這意味着價值實現時間將大大縮短,將 AI 從長期投資轉變爲立即推動競爭優勢的動力,今天投資於專門設計的 AI 工廠的公司將在明天的創新、效率和市場競爭中領先。

黃仁勳稱,智能不是副產品,而是核心。這種智能通過 AI Token吞吐量來衡量——即驅動決策、自動化以及全新服務的實時預測。AI 工廠則優化於從 AI 中創造價值,它們協調整個 AI 生命週期,包括從數據攝取到訓練、微調和最關鍵的高量推理。

當然,黃仁勳的目的很簡單:多買英偉達GPU,儘管性能很難快速提升但可以多買芯片實現龐大計算規模,AI 需要的大量算力都可以在英偉達平臺計算,計算、通信、模型、工具、軟件平臺通通都有,英偉達能得到收入,各國能得到 AI 最強國地位。

此外,黃仁勳再次更新了“黃氏定律”,他認爲,推理已成爲 AI 經濟的主要驅動力,因此Scaling Law有三個層面:

預訓練擴展:更大的數據集和模型參數可帶來可預測的智能增益,但要達到這一階段需要對熟練的專家、數據管理和計算資源進行大量投資。在過去五年中,預訓練擴展使計算需求增加了 5000 萬倍。但是,一旦模型經過訓練,其他人在其基礎上進行構建的門檻就會大大降低。

訓練後擴展:針對特定實際應用對 AI 模型進行微調,在 AI 推理過程中所需的計算量是預訓練的30 倍。隨着組織根據其獨特需求調整現有模型,對 AI 基礎設施的累計需求猛增。

測試時間擴展(又稱長期思考):代理 AI或物理 AI等高級 AI 應用需要迭代推理,其中模型會探索多種可能的響應,然後再選擇最佳響應。這比傳統推理消耗的計算量最多高出 100 倍。

所以,黃仁勳如此努力,連前英特爾CEO基辛格(Pat Gelsinger)都來現場誇獎老黃,成爲黃仁勳最新擁躉者。

基辛格表示,英偉達團隊對 AI 做出了巨大貢獻。據悉,如今“退休”的基辛格,創立了教會通訊平臺Gloo,他擔任董事長,並將大模型作爲其聊天機器人的基石,當然,他們也買了英偉達的算力。

基辛格還談到量子計算,認爲其發展對於通用 AI 至關重要。基辛格稱,不太同意老黃的一點是,他認爲量子計算將在這個十年結束之前以可實現的形式出現,即未來5年內人類將在生產中使用可實現的量子計算機。

“絕對的,未來數據中心有部分工作負載、數據處理等,會有訓練工作量,因此,我們會有量子計算處理器,如果你想想量子,人類的大部分,人類最有趣的事情就是量子效應。有一個計算模型來研究這些事情是非常合適的。就像GPU看起來更像是大腦,用於訓練、人類和語言以及所有這些東西,所以我堅信這就是未來的數據中心。”基辛格表示。

因此,今年GTC大會,除了黃仁勳的主題演講,還有一件事最值得期待:首次設立“量子日”活動。

屆時,黃仁勳將與D-Wave Quantum和Rigetti Computing等十餘家量子計算行業領軍企業的高管同臺,討論量子計算的技術現狀、潛力以及未來發展方向。

今天,英偉達已經宣佈在波士頓建立一個量子研究中心 (NVAQC) ,以提供推動量子計算發展的尖端技術,把領先的量子硬件與 AI 超級計算機集成在一起,實現所謂的加速量子超級計算,幫助解決量子計算最具挑戰性的問題,從量子比特噪聲到將實驗性量子處理器轉變爲實用設備。

該研究院包括Quantinuum、Quantum Machines 和QuEra Computing,以及哈佛大學科學與工程量子計劃 (HQI) 和麻省理工學院 (MIT) 的工程量子系統 (EQuS) 小組等。

“NVAQC 是一個強大的工具,將有助於引領整個量子生態系統的下一代研究,”麻省理工學院電子工程與計算機科學教授、物理學教授、EQuS 小組負責人兼量子工程中心主任 William Oliver 表示。“NVIDIA 是實現實用量子計算的重要合作伙伴。”

黃仁勳則強調,量子計算將增強 AI 超級計算機的能力,以解決從藥物發現到材料開發等世界上一些最重要的問題。英偉達加速量子研究中心將與更廣泛的量子研究界合作,推動 CUDA-量子混合計算的發展,並取得突破,打造出大規模、實用、加速的量子超級計算機。

很顯然,下一個 AI 計算未來,黃仁勳也想全面佈局,推動英偉達成爲 AI 算力領域的持續性“霸主”。

(本文首發於鈦媒體App,作者|林志佳)

免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。

熱議股票

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10