國產GPU斬獲14.88億元AI訓推一體機大單

芯智訊
02-26

隨着國產AI大模型DeepSeek的持續火爆,DeepSeek官方服務器一直是超負荷,已經無法滿足龐大的用戶需求。特別是對於數據隱私安全及有着二次訓練需求企業級用戶,已經開始紛紛在本地部署滿血版DeepSeek大模型。這也直接帶動了市場對於AI一體機的需求。這其中,相比英偉達GPU更具性價比的國產AI芯片方案受到了市場的青睞。

國產AI一體機市場百花齊放

據不完全統計,到2025年2月,至少有20家國產芯片廠商宣佈與DeepSeek展開合作,其中就包括了華爲升騰、百度崑崙芯、海光、沐曦集成電路、摩爾線程等知名AI芯片廠商。通過國產AI模型+國產AI芯片的組合,國內AI生態開始打破英偉達的CUDA生態限制,推動“國產算力+國產大模型”生態系統的建設。

華爲推出的升騰DeepSeek一體機,採用了升騰高性能算力底座,深度融合了DeepSeek全系列大模型能力,能夠滿足語言理解、圖像分析、知識推理等全場景應用需求。

中國電信推出的“息壤智算一體機”基於華爲升騰910B芯片,提供了全棧國產化推理服務,支持DeepSeek-R1/V3系列模型,支持全棧國產化推理服務,滿足大型企業和政府機構對高穩定性和高併發性能的需求。

中國移動也發佈了以國產CPU/GPU爲核心的“智算一體機-DeepSeek版”,爲企業提供“開箱即用”的私有化部署體驗,適合快速部署AI應用。

拓維信息推出的兆瀚AI服務器也是基於升騰芯片,主要針對政務與教育領域的高併發需求,支持DeepSeek-R1/V3全系列模型,並提供快速部署的能力。

浪潮信息則推出了基於國產GPU(如沐曦芯片)的“海若一體機”,該一體機支持DeepSeek 671B大模型的單機推理,適用於複雜決策場景;而京東雲則推出了支持多種國產AI加速芯片的DeepSeek一體機,幫助企業部署更高效的AI解決方案。

百度智能雲也推出了搭載崑崙芯P800的“百舸DeepSeek一體機”,具備顯著的成本優勢。據介紹,百度的“百舸DeepSeek一體機”支持高性能的訓練與推理需求,單機高吞吐,能夠滿足500人團隊併發使用,響應速度極快,且運維成本低。

國產沐曦GPU的特定行業總代理商超訊通信,依託沐曦GPU良好的兼容性和適配能力,近期也推出“元醒”訓練推理一體機,爲客戶提供本地化部署全棧式DeepSeek-R1/V3解決方案。

基於沐曦GPU,超訊通信拿下14.88億元大單

2月24日,超訊通信發佈公告稱,公司與深圳市星航智算科技有限公司簽訂《智算集成服務採購合同》,合同含稅總金額約爲人民幣6.38億元。採購清單包含元醒曦雲C500- P PCle訓推一體服務器、交換機、光纖、光模塊、網線及其他、智算雲平臺、大模型智能體平臺、大模型數據知識平臺及AI應用平臺。

公告稱,本合同的簽訂及正常履行將有利於實現公司所代理的“沐曦”GPU產品和自有“元醒”品牌算力服務器的批量銷售,爲公司算力業務拓展帶來更多的市場機會。相關銷售收入的確認將隨着本合同的逐步履行而分階段進行,若本合同能全部順利履行,將對公司未來業績產生積極影響。

在此前的2月7日,超訊通信還曾發佈公告稱,公司與中特新聯科技產業發展(北京)有限公司簽訂《採購合同》及對應《採購訂單》,客戶向公司採購智算集成服務,合同含稅總金額約爲人民幣8.5億元。合同標的主要爲元醒曦雲C500-P PCie訓推一體服務器、交換機、光纖、光模塊、網線及其他、智算雲平臺、大模型智能體平臺、大模型數據知識平臺及AI應用平臺。

需要指出的是,由於DeepSeek模型大幅降低了對於算力的需求,再加上模型的開源,打破了英偉達CUDA生態束縛,使得相比英偉達GPU更具性價比的國產AI芯片方案受到了AI訓推一體機市場的青睞。

一個月內,超訊通信接連拿下了合計14.88億元的基於沐曦曦雲C500芯片方案的訓推一體服務器大單,足見目前該市場對於沐曦AI芯片方案的認可。

資料顯示,沐曦成立於2020年的,其創始人陳維良曾任AMD全球GPGPU設計總負責人;聯合創始人、CTO兼首席硬件架構師彭莉是AMD全球首位華人女科學家(Fellow), 曾任AMD首席架構師,擁有15年高性能GPU設計經驗;聯合創始人兼軟件CTO楊建博士是AMD大中華地區第一位科學家(Fellow),歷任AMD、海思等首席架構師,擁有20年大規模芯片及GPU軟硬件設計經驗。

目前沐曦擁有用於AI推理的MXN系列GPU(曦思);面向AI訓練、AI推理及通用計算的MXC系列(曦雲)通用GPU(GPGPU)芯片;針對圖形渲染加速的MXG系列(曦彩)GPU。

據相關報道顯示,曦雲C500在2023年6月就完成芯片功能測試,該芯片採用7nm製程, GPGPU架構,目標FP32算力達到15TFLOPS,大約達到了英偉達A100(FP32性能爲19.5TFLOPS)的75%的算力。同樣,曦雲C500也支持多卡互聯。

2023年8月,沐曦發佈新聞稿稱,曦雲C500千億參數AI大模型訓練及通用計算GPU與北京智譜華章科技有限公司開源的中英雙語對話語言模型ChatGLM2-6B完成適配。測試結果顯示,曦雲C500在智譜AI的升級版大模型上充分兼容、高效穩定運行。

今年2月初,在DeepSeek剛剛火爆網絡之時,沐曦也聯合中國開源大模型平臺Gitee AI發佈了全套DeepSeek-R1千問蒸餾模型,隨後DeepSeek-R1、DeepSeek-V3 型均實現了在基於曦雲GPU訓推一體上成功運行。2月24日,沐曦還宣佈其GPU率先跑通DeepSeek開源代碼庫FlashMLA。

免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。

熱議股票

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10