IBM企業級AI開發平台watsonx.ai線DeepSeek R1蒸餾模型

IT之家 2 月 11 日消息，IBM 日前宣佈，DeepSeek-R1 蒸餾版 Llama 3.1 8B 和 Llama 3.3 70B 現已上線 IBM 的企業級 AI 開發平台 watsonx.ai。

根據官方介紹，DeepSeek 還藉助知識蒸餾技術，利用 R1 模型生成的數據優化了多個 Llama 和 Qwen 變體。用戶可通過以下方式在 watsonx.ai 上使用 DeepSeek 蒸餾模型：

在 watsonx.ai 的「按需部署」目錄中，IBM 提供 Llama 蒸餾版，用戶可以部署專用實例以進行安全推理。

用戶還可通過「自定義基礎模型」導入功能，上傳 DeepSeek-R1 其他變體，例如 Qwen 蒸餾模型。

DeepSeek-R1 具備強大的推理能力，適用於多個領域：

規劃：其「鏈式思維」邏輯有助於處理需要逐步推理的任務，特別適合智能體（agentic）應用。

編程：可用於代碼生成、調試和優化，提升開發效率。

數學問題求解：具備處理複雜數學問題的能力，在科研、工程和科學計算等領域表現突出。

開發者可在 watsonx.ai 上利用 DeepSeek-R1 進行 AI 解決方案開發，並使用以下解決方案能力：

直觀測試和評估模型輸出

通過連接向量數據庫和嵌入模型構建 RAG（檢索增強生成）管道

支持 LangChain、CrewAI 等主流 AI 框架

IBM watsonx.ai 提供靈活的開源模型定製選項，支持 DeepSeek-R1 在不同環境下的部署，並簡化智能體開發、微調、RAG、提示工程等工作流。此外，watsonx.ai 內置安全機制，保障用戶應用的安全性。

據IT之家此前報道，IBM 首席執行官本月初曾發表長文稱，他們（DeepSeek）僅用約 2000 枚英偉達芯片，以大約 600 萬美元的成本訓練了最新的模型，遠低於行業預期。這再次證明，小型、高效的模型也能帶來實際成果，無需依賴龐大而昂貴的專有系統。

免責聲明：投資有風險，本文並非投資建議，以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請，作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考，不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證，投資者應自行研究並在投資前尋求專業建議。

老虎證券

IBM企業級AI開發平台watsonx.ai線DeepSeek R1蒸餾模型

熱議股票