毅伯智算發佈DeepSeek滿血版一體機,性能超英偉達四成

鈦媒體
03-13

爲向行業提供真實、可驗證的推理性能,軟硬協同算力解決方案提供商毅伯智算,近日向市場全新推出搭載滿血版DeepSeek-R1-671B的8卡推理一體機TORA3000,其推理性能相比英偉達H20-141G高出四成,達到業界領先水平,並且實現了硬件、組網、功耗的綜合成本最優。

毅伯智算是國內少有的實現全棧自研的軟硬協同算力解決方案提供商,團隊凝聚了超百人的AI工程師,其中核心成員在人工智能與超算領域擁有超10年的研發經驗。過去三年,團隊始終致力於全棧式AI訓推平臺的研發,並於2024年依託新組建的毅伯智算主體,推出了全棧式AI訓推平臺。2025年3月,毅伯智算進一步推出搭載DeepSeek模型的自研8卡推理一體機TORA3000。

TORA3000是軟硬件一體化解決方案,開箱即用,全面滿足客戶推理需求。毅伯智算憑藉其軟硬件一體化的綜合優勢,提供最具性價比的一體機解決方案,1機8卡即能實現上述性能,顯著降低客戶硬件成本,原生支持 DeepSeek-R1-671B 所採用的FP8 精度,兼容FP64/32/16 及INT8,在保證推理精度的同時有效降低部署成本,通過全自研的算子庫、編譯技術、推理框架等技術手段,實現更快計算效率、長文本和高併發請求支持、更高推理性能。

對於企業用戶來說,Deepseek推理一體機選擇滿血版還是蒸餾版?本質上,滿血版與蒸餾版類似於教師和學生的關係,即前者是知識輸出者,後者通過知識蒸餾過程繼承前者的知識。在實際應用中,滿血版可深度處理代碼生成、知識圖譜構建等高複雜度任務;而蒸餾版作爲學生模型,受限於知識壓縮與固定架構,僅適用於應用特別定義且相對簡單場景。對於大中型企業,至少需配置滿血版一體機作爲核心引擎,以支撐業務迭代與高密度推理需求。

受GPU硬件性能的限制,市場上滿血版推理一體機存在單機、雙機甚至四機等多種部署方案,但是雙機方案相對單機方案的硬件成本和功耗會都會翻倍,四機則更高,並增加額外的組網和運維成本。在Deepseek原生FP8精度下,一體機(8卡)要流暢運行滿血模型,單卡顯存需大於120G(整機顯存大於1000GB),顯存不足則必須採用多機部署。同時,部分GPU不支持FP8運算,只能量化爲INT8或FP16模型,但INT8精度下,推理精度會所有下降,FP16會導致所需顯存和節點數量翻倍。爲降低部署成本、簡化部署複雜性並保證性能,1臺標準8卡服務器上部署原生FP8精度的DeepSeek-R1-671B模型是最優選擇,但此方案要求GPU支持FP8精度且單卡顯存超過120GB,而目前市場上僅有毅伯智算的TORA3000和英偉達H20-141G可以滿足。經採用開源數據集和開源測試工具對兩者推理性能進行測試發現,毅伯智算的TORA3000相比英偉達H20-141G,性能提升達40%,達到業界領先水平。

免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。

熱議股票

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10