聯想:AI服務器首次實現低於1TB本地部署DeepSeek滿血大模型

新浪科技
03-04

  新浪科技訊 3月4日上午消息,近日,聯想集團宣佈基於聯想問天WA7780 G3服務器,在行業內首次實現單機部署DeepSeek-R1/V3 671B大模型,以低於行業公認1TGB顯存(實際768GB)承載多併發用戶流暢體驗,可以滿足千人企業的使用需求,爲行業樹立了企業級大模型部署新基準。

  作爲全球關注的焦點,衆多企業正準備在本地化部署DeepSeek大模型。然而,在落地實施過程中用戶普遍面臨以下關鍵決策難題:單機能否部署滿血版DeepSeek R1?所需最低配置是什麼?如何確保高併發與吞吐量下的優質體驗?如何避免採購陷阱?

  聯想此次突破爲企業提供科學選型指南。針對行業公認1TB顯存是千億參數大模型運行基線的背景下,聯想研發團隊通過專家並行優化、智能訪存架構升級及PCIe 5.0全互聯架構創新,大幅提升了顯存利用率,從而實現了性能的提升。

  據瞭解,聯想WA7780 G3服務器在2月初已實現單機768GB GPU顯存條件下部署DeepSeek 671B R1和V3滿血模型,並能滿足中小企業的併發需求。進而通過聯想萬全異構智算平臺的訪存優化,專家並行調用策略等技術優化手段,實現了單機一個月內併發能力增長10倍, 同時還提升了每路用戶的TPOT、TTFT等綜合性能體驗。(羅寧)

海量資訊、精準解讀,盡在新浪財經APP

責任編輯:江鈺涵

免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。

熱議股票

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10