
隨着國產AI大模型DeepSeek的持續火爆,DeepSeek官方服務器一直是超負荷,已經無法滿足龐大的用戶需求。特別是對於數據隱私安全及有着二次訓練需求企業級用戶,已經開始紛紛在本地部署滿血版DeepSeek大模型。這也直接帶動了市場對於AI一體機的需求。這其中,相比英偉達GPU更具性價比的國產AI芯片方案受到了市場的青睞。
國產AI一體機市場百花齊放
據不完全統計,到2025年2月,至少有20家國產芯片廠商宣佈與DeepSeek展開合作,其中就包括了華為升騰、百度崑崙芯、海光、沐曦集成電路、摩爾線程等知名AI芯片廠商。通過國產AI模型+國產AI芯片的組合,國內AI生態開始打破英偉達的CUDA生態限制,推動「國產算力+國產大模型」生態系統的建設。
華為推出的升騰DeepSeek一體機,採用了升騰高性能算力底座,深度融合了DeepSeek全系列大模型能力,能夠滿足語言理解、圖像分析、知識推理等全場景應用需求。
中國電信推出的「息壤智算一體機」基於華為升騰910B芯片,提供了全棧國產化推理服務,支持DeepSeek-R1/V3系列模型,支持全棧國產化推理服務,滿足大型企業和政府機構對高穩定性和高併發性能的需求。
中國移動也發布了以國產CPU/GPU為核心的「智算一體機-DeepSeek版」,為企業提供「開箱即用」的私有化部署體驗,適合快速部署AI應用。
拓維信息推出的兆瀚AI服務器也是基於升騰芯片,主要針對政務與教育領域的高併發需求,支持DeepSeek-R1/V3全系列模型,並提供快速部署的能力。
浪潮信息則推出了基於國產GPU(如沐曦芯片)的「海若一體機」,該一體機支持DeepSeek 671B大模型的單機推理,適用於複雜決策場景;而京東雲則推出了支持多種國產AI加速芯片的DeepSeek一體機,幫助企業部署更高效的AI解決方案。
百度智能雲也推出了搭載崑崙芯P800的「百舸DeepSeek一體機」,具備顯著的成本優勢。據介紹,百度的「百舸DeepSeek一體機」支持高性能的訓練與推理需求,單機高吞吐,能夠滿足500人團隊併發使用,響應速度極快,且運維成本低。
國產沐曦GPU的特定行業總代理商超訊通信,依託沐曦GPU良好的兼容性和適配能力,近期也推出「元醒」訓練推理一體機,為客戶提供本地化部署全棧式DeepSeek-R1/V3解決方案。
基於沐曦GPU,超訊通信拿下14.88億元大單
2月24日,超訊通信發布公告稱,公司與深圳市星航智算科技有限公司簽訂《智算集成服務採購合同》,合同含稅總金額約為人民幣6.38億元。採購清單包含元醒曦雲C500- P PCle訓推一體服務器、交換機、光纖、光模塊、網線及其他、智算雲平台、大模型智能體平台、大模型數據知識平台及AI應用平台。
公告稱,本合同的簽訂及正常履行將有利於實現公司所代理的「沐曦」GPU產品和自有「元醒」品牌算力服務器的批量銷售,為公司算力業務拓展帶來更多的市場機會。相關銷售收入的確認將隨着本合同的逐步履行而分階段進行,若本合同能全部順利履行,將對公司未來業績產生積極影響。
在此前的2月7日,超訊通信還曾發布公告稱,公司與中特新聯科技產業發展(北京)有限公司簽訂《採購合同》及對應《採購訂單》,客戶向公司採購智算集成服務,合同含稅總金額約為人民幣8.5億元。合同標的主要為元醒曦雲C500-P PCie訓推一體服務器、交換機、光纖、光模塊、網線及其他、智算雲平台、大模型智能體平台、大模型數據知識平台及AI應用平台。
需要指出的是,由於DeepSeek模型大幅降低了對於算力的需求,再加上模型的開源,打破了英偉達CUDA生態束縛,使得相比英偉達GPU更具性價比的國產AI芯片方案受到了AI訓推一體機市場的青睞。
一個月內,超訊通信接連拿下了合計14.88億元的基於沐曦曦雲C500芯片方案的訓推一體服務器大單,足見目前該市場對於沐曦AI芯片方案的認可。
資料顯示,沐曦成立於2020年的,其創始人陳維良曾任AMD全球GPGPU設計總負責人;聯合創始人、CTO兼首席硬件架構師彭莉是AMD全球首位華人女科學家(Fellow), 曾任AMD首席架構師,擁有15年高性能GPU設計經驗;聯合創始人兼軟件CTO楊建博士是AMD大中華地區第一位科學家(Fellow),歷任AMD、海思等首席架構師,擁有20年大規模芯片及GPU軟硬件設計經驗。
目前沐曦擁有用於AI推理的MXN系列GPU(曦思);面向AI訓練、AI推理及通用計算的MXC系列(曦雲)通用GPU(GPGPU)芯片;針對圖形渲染加速的MXG系列(曦彩)GPU。
據相關報道顯示,曦雲C500在2023年6月就完成芯片功能測試,該芯片採用7nm製程, GPGPU架構,目標FP32算力達到15TFLOPS,大約達到了英偉達A100(FP32性能為19.5TFLOPS)的75%的算力。同樣,曦雲C500也支持多卡互聯。
2023年8月,沐曦發布新聞稿稱,曦雲C500千億參數AI大模型訓練及通用計算GPU與北京智譜華章科技有限公司開源的中英雙語對話語言模型ChatGLM2-6B完成適配。測試結果顯示,曦雲C500在智譜AI的升級版大模型上充分兼容、高效穩定運行。
今年2月初,在DeepSeek啱啱火爆網絡之時,沐曦也聯合中國開源大模型平台Gitee AI發布了全套DeepSeek-R1千問蒸餾模型,隨後DeepSeek-R1、DeepSeek-V3 型均實現了在基於曦雲GPU訓推一體上成功運行。2月24日,沐曦還宣佈其GPU率先跑通DeepSeek開源代碼庫FlashMLA。