IBM用最新芯片,打造了一個大型機

半導體行業觀察
04-09

來源:內容編譯自theregister,謝謝。

IBM 的最新大型機以平臺傳統的關鍵任務工作負載的安全性和可靠性屬性爲基礎,添加了 AI 來支持大型語言模型 (LLM)、助手和代理。

z17 系列引入了改進的 Telum II 處理器和 Spyre AI 加速器卡,這兩者都是在去年帕洛阿爾託舉行的Hot Chips 會議上討論過的,據稱其 AI 性能比 z16 提高了 7.5 倍。

IBM 聲稱,雖然 Telum II 提供了改進的 AI 推理來針對交易運行欺詐檢測檢查(就像z16 中引入的那樣),但 Spyre 卡提供了一種擴展 AI 處理的方法,以支持生成 AI 和 LLM,並使用多種模型來提高準確性並減少誤報。

IBM 院士兼 IBM Z 架構師 Elpida Tzortzatos 在談到藍色巨人爲這款最新大型計算機開發的硬件增強功能時表示:“如果將數據視爲新的燃料,那麼基礎設施就是推動企業 AI 之旅走向成功的引擎。”

該公司表示,他們花了很多時間與客戶討論他們希望在大型機中看到什麼,這爲 z17 的開發提供了參考。客戶顯然告訴他們要更新他們的應用程序並使大型機更加人工智能驅動。

但這並不是像其他一些公司那樣,將生成式人工智能簡單地投入到其中。藍色巨人聲稱已經仔細考慮過這個問題。

Tzortzatos 表示:“GenAI 對我們的客戶來說非常重要,但也不是唯一的 AI 工具。儘管最近有很多關於 GenAI 的討論,但預測性 AI 仍將在企業中發揮關鍵作用。”

“我們將繼續非常非常好地服務於這些用例,但 GenAI 爲新的用例打開了大門,例如擁有助手並能夠總結文檔,能夠爲開發人員提供支持,讓副駕駛能夠自動完成代碼等等。”

這些助手包括該公司的watsonx Code Assistant for Z 和 watsonx Assistant for Z 等。

Tzortzatos 聲稱,該公司看到的一個新趨勢是將預測人工智能的優勢與大型語言和代碼模型的優勢結合起來,以提取新特徵或新見解,並從這些人工智能模型中獲得更好、更準確的結果。

她舉了一個保險的例子,保險公司從 DB2 數據庫中提取與索賠相關的結構化信息,然後從非結構化文本中提取關鍵見解(例如索賠原因或索賠緊急程度),並將其輸入預測 AI 模型以獲得更好、更準確的結果。

根據 Hot Chips 的詳細介紹,z17 中的 Telum II 處理器與上一代一樣是八核芯片,但運行速度更高,爲 5.5 GHz。Telum II 的緩存大小也增加了 40%,並增加了另一項新功能——片上 IO 加速器或數據處理單元 (DPU),旨在卸載 Spyre AI Accelerator 卡在處理較新的 AI 模型時需要處理的大量數據。

Tzortzatos 解釋說:“當談到大型語言模型和 GenAI 時,我們看到模型複雜性和模型尺寸增加了超過一百倍,這對 AI 計算提出了更高的要求。”

這些 Spyre AI 加速器卡可插入 PCIe 插槽,每個卡最多有 32 個核心,據說與 Telum II 芯片本身的 AI 加速器架構類似。IBM 表示,z17 可以在單個系統中擁有最多 48 張卡。

藍色巨人還在準備 z/OS 3.2,這是其爲 IBM Z 系統開發的下一個主要操作系統版本,計劃於今年第三季度發佈。這將爲整個系統提供對硬件加速 AI 功能的支持,並使用運營 AI 實現系統管理功能。

IBM 表示,新平臺將增加對現代數據訪問方法、NoSQL 數據庫和混合雲數據處理的支持,以使 AI 能夠利用更廣泛的企業數據來應用預測性業務洞察。

IBM 推出新款大型機正值這種高價位產品的艱難時期,特朗普政府的國際貿易政策動搖了商業信心。傳統上,隨着舊系統客戶升級,新大型機的推出將爲藍色巨人帶來收入激增,但今年的銷售可能會很困難。

然而,Gartner 基礎設施和運營集團執行副總裁 Mike Chuba 表示,公司已經充分了解客戶的需求。

Chuba 向The Register表示:“如果你回顧一下最近幾代大型機的發佈會,並繼續回顧這一代,你會發現,IBM 在涉及大型大型機客戶的研發過程中投入了更多時間。”

“IBM 的研發工作現在專注於新硬件如何直接解決客戶面臨的挑戰。他們在 z16 上引入的專用加速器和這一代的渦輪增壓版 2 直接解決了交易時欺詐檢測等挑戰,從而專注於人工智能。”

IBM 的的新芯片

去年,IBM 爲其著名的大型機系統推出了一款更強大的處理器,承諾增強用於推理的片上 AI 加速,並集成數據處理單元 (DPU) 以增強 IO 處理能力。

IBM還爲其提供了一個單獨的 AI 加速器,旨在支持更大規模的推理。

據藍色巨人稱, Telum II 處理器在帕洛阿爾託舉行的Hot Chips 2024大會上發佈,預計將爲大型機帶來顯著的性能提升。該公司還預覽了 Spyre AI Accelerator,並表示預計這兩款芯片將於 2025 年上半年與下一代 IBM Z 系統一起推出。

如果 IBM 的說法可信的話,那麼全球大約 70% 的交易都是通過其大型機進行的,而 IBM 表示,它在 Hot Chips 上展示的開發成果將使其能夠將生成性 AI 引入這些關鍵任務工作負載。

Telum II 和其前代產品一樣,是一款八核芯片,但在新芯片中,這些芯片的時鐘速度更高,爲 5.5GHz。有十個 36 MB 二級緩存;每個內核一個,DPU 一個,第十個作爲整體芯片緩存。IBM 表示,隨着虛擬 L3 和虛擬 L4 分別增長到 360 MB 和 2.88 GB,這意味着緩存大小增加了 40%。

首款 Telum 處理器於 2022 年推出時爲 z16 帶來了內置 AI 推理功能。它能夠在處理金融交易時對其進行實時欺詐檢測檢查。

藍色巨人表示,它已顯著增強 Telum II 處理器上的 AI 加速器功能,達到每秒 24 萬億次運算 (TOPS)。但正如The Register之前所解釋的那樣,TOPS 可能是一個誤導性指標。雖然增加了對 INT8 作爲數據類型的支持,但 Telum II 本身的設計旨在使模型運行時能夠與最苛刻的企業工作負載並行運行。

添加片上 DPU是爲了幫助滿足不斷增長的工作負載需求,特別是着眼於未來的 AI 工作負載和即將推出的 Z 系統 Spyre 加速器。

據 Armonk 公司介紹,每個 DPU 包括四個處理集羣,每個集羣有八個可編程微控制器和一個管理這些處理集羣的 IO 加速器,以及兩個 IO 抽屜域的 IO 子系統。DPU 還具有單獨的 L1 緩存和請求管理器來跟蹤未完成的請求。

DPU 位於主處理器結構和 PCIe 結構之間。將其直接連接到結構的目的是大大減少數據傳輸的開銷,同時提高吞吐量和功率效率。

IBM 表示,作爲最高配置,未來的 Z 系統可能擁有多達 32 個 Telum II 處理器和 12 個 IO 籠,每個籠子最多有 16 個 PCIe 插槽,使系統總共支持多達 192 個 PCIe 卡,大大擴展了 IO 容量。

Spyre 加速器將包含 32 個核心,其架構與集成在 Telum II 芯片中的 AI 加速器類似。IBM Z 可以配置多個 Spyre 加速器,通過 PCIe 安裝,以便根據需要擴展 AI 加速。例如,八張卡的集羣將爲單個 IBM Z 系統添加 256 個加速器核心。

Telum II 和 Spyre Accelerator 均旨在支持 IBM 所稱的集成 AI,即使用多個 AI 模型來提高與單個模型相比的預測性能和準確性。

藍色巨人 IBM Z 和 LinuxONE 產品管理副總裁 Tina Tarquinio 在評論中表示:“Telum II 處理器和 Spyre 加速器旨在提供高性能、安全且更節能的企業計算解決方案。”

她補充道:“經過多年的開發,這些創新將被引入我們的下一代 IBM Z 平臺,以便客戶可以大規模利用 LLM 和生成式 AI。”

藍色巨人希望超越推理,在其大型機上進行微調,甚至可能訓練模型。該公司表示,這將使銀行和其他希望將數據安全保存在自己場所的企業等客戶能夠完全在組織內部訓練和部署模型。

Telum II 和 Spyre Accelerator 都將由三星採用 5 nm 工藝節點爲 IBM 生產。

免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。

熱議股票

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10