新報告估計DeepSeek硬件支出可能高達5億美元

鞭牛士Bianews
02-01

鞭牛士報道,2月1日消息,據CNBC報道,中國的DeepSeek成爲本週科技界最大的話題,許多業內人士和華爾街人士都關注一個數字:600萬美元。

DeepSeek 在關於其最新人工智能模型的論文中表示,DeepSeek 包含一個明確的警告,稱該數字僅包括模型的官方訓練,不包括與架構、算法或數據的先前研究和消融實驗相關的成本。

本週早些時候,DeepSeek 的 AI Assistant 取代 OpenAI 的 ChatGPT,成爲美國蘋果應用商店下載次數最多的免費應用程序。全球科技股遭遇拋售,芯片製造商英偉達博通週一總市值蒸發了8000 億美元。

半導體研究和諮詢公司 SemiAnalysis 的一份新報告爲DeepSeek 的開支提供了更多背景信息。

該公司估計,DeepSeek 的硬件支出在公司歷史上遠高於 5 億美元,並補充說研發成本和總擁有成本相當高。

SemiAnalysis 寫道,爲模型生成訓練所需的合成數據需要大量的計算。

報道稱,Anthropic 的 Claude 3.5 Sonnet 訓練成本數千萬美元,但指出 Anthropic 從亞馬遜籌集了數十億美元和谷歌,這表明運營這些模型和公司需要多少錢。

SemiAnalysis 表示:這是因爲他們必須進行實驗、提出新的架構、收集和清理數據、支付員工工資等等。

DeepSeek 自己的論文並未包含對其計算成本的估計。該公司沒有立即回應置評請求。

SemiAnalysts 寫道:需要明確的是,DeepSeek 的獨特之處在於他們率先實現了這種成本和能力水平。

該公司補充說,DeepSeek 的 R1是一個非常好的模型,並且如此迅速地趕上推理前沿確實令人印象深刻。

本週,專家和分析師對 DeepSeek 模型的質量大加讚賞,並指出考慮到美國 三年內三次限制對華芯片出口,該模型令人印象深刻。這引發了人們的擔憂,即美國 在一個預計十年內收入將超過 1 萬億美元的 市場上落後於其主要對手 。

伯恩斯坦分析師在週一的一份報告中寫道,根據我們(週末)看到的許多(偶爾歇斯底里的)熱門言論,其影響範圍從這真的很有趣到這是我們所知的人工智能基礎設施綜合體的喪鐘。

DeepSeek 成立於 2023 年,創始人是專注於人工智能的量化對沖基金 High-Flyer 的聯合創始人梁文峯。據報道,這家人工智能初創公司於 2023 年 4 月從對沖基金的人工智能研究部門中脫穎而出,專注於大型語言模型和通用人工智能(AGI)——人工智能的一個分支,它在廣泛的任務上等同於或超越人類智力,OpenAI 和其他公司正在追求這一目標。

傑富瑞 (Jefferies) 分析師表示,DeepSeek 仍由 High-Flyer 全資擁有並獲得資助。

本月初,DeepSeek 發佈了 R1,該模型可與 OpenAI 的 o1 相媲美,由此引發的討論開始升溫。R1 是開源的,這意味着任何 AI 開發人員都可以使用它。

OpenAI 首席執行官 Sam Altman 公開稱讚了該模型,但該公司也表示,有證據表明 DeepSeek不正當地收集了OpenAI 數據來構建其產品。

在週四由 OpenAI 於華盛頓特區舉辦的一場活動上,奧爾特曼表示,DeepSeek顯然是一個很棒的模型。

他說:這提醒我們競爭的水平以及人工智能獲勝的必要性。

他說,這也表明了對推理的興趣水平,對開源的興趣水平。

免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。

熱議股票

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10