時代週刊:國產 AI 黑馬 DeepSeek 一鳴驚人,硅谷“顫抖”

BitPush
01-28

來源:TIME

原標題:What to Know About DeepSeek, the Chinese AI Company Causing Stock Market Chaos

作者:Billy Perrigo、Tharin Pillay

編譯及整理:比推BitpushNews


近日,中國杭州初創公司 DeepSeek 創建的新型 AI 模型震驚了美國 AI 業。它的表現超越了OpenAI的領先模型,取代ChatGPT 登頂 iOS 應用商店的榜首,並替代Meta成爲“開源 AI 工具”的領先供應商。

所有敘事都指向一個關鍵問題:儘管美國對中國獲取先進半導體的能力實施了制裁,但中國在全球 AI 競賽中是否正在趕上美國?

DeepSeek 上週發佈的新 R1 模型據稱訓練成本僅爲 600 萬美元,但在多個數學和推理指標上的表現卻能與OpenAI 的 o1 模型相媲美——這是 OpenAI 及其支持者微軟數百億美元投資的成果。

中國模式對用戶來說也更便宜。使用其最強大版本的成本比 OpenAI 及其競爭對手低 95% 左右。結果是:美國科技行業突然面臨一個可能更便宜、更強大的挑戰者,這讓投資者感到不安,週一開盤,美國科技股遭遇瘋狂拋售。

但並非所有人都相信,一些美國人工智能研究人員對DeepSeek真實的成本、以及部署了多少先進芯片來創建模型的說法表示懷疑。

然而,很少有人質疑 DeepSeek 的驚人能力。

美國著名風險投資家馬克·安德森 (Marc Andreessen)在 X 上寫道:“Deepseek R1 是人工智能的斯普特尼克時刻” ,斯普特尼克指的是冷戰期間蘇聯成功將一顆衛星送入軌道的時刻。

那麼,DeepSeek 是什麼?它對美國科技霸權意味着什麼?

什麼是 DeepSeek?

DeepSeek 成立於不到兩年前,由中國對沖基金幻方資本 (High-Flyer Capital Management) 創立,是一家致力於研究通用人工智能 (AGI) 的研究實驗室。2024 年底發佈的一系列開源版本讓這家初創公司名聲大噪,其中包括大型語言模型“v3”,其表現優於 Meta 的所有開源 LLM,可與 OpenAI 的閉源 GPT4-o 相媲美。

當時,首席執行官梁文峯表示,他聘請了一批年輕的計算機科學研究團隊,目的是“解決世界上最難的問題”——關鍵是,不以盈利爲目的。早期成果令人鼓舞:他的產品非常高效,以至於 DeepSeek 2024 年的發佈引發了中國人工智能行業的價格戰,迫使競爭對手大幅降價。

今年,這場價格戰似乎將蔓延至太平洋彼岸。

然而,DeepSeek 的人工智能與美國競爭對手有一個重要區別。 儘管 DeepSeek 的模型在推理測試中表現出色,但它們受到一些政策的限制。例如,DeepSeek R1 拒絕回答某些較爲敏感的歷史話題。

DeepSeek 的成功對美國科技巨頭意味着什麼

正當谷歌、Meta、微軟、亞馬遜及其數十家競爭對手準備再投入數百億美元建設新的人工智能基礎設施時,DeepSeek 的成功引發了一個令人不安的問題:中國科技公司是否有可能在投入更少的情況下匹敵甚至超越硅谷的技術實力?

據科技新聞網站 The Information 上週末報道,Meta 計劃今年在人工智能基礎設施上投入 650 億美元,目前已經建立了四個“作戰室”來分析 DeepSeek 的模型,試圖找出這家中國公司如何以如此低的成本訓練模型,並利用這些見解改進自己的開源 Llama模型。

在金融市場,由於擔心訓練強大的人工智能所需的人工智能芯片數量可能比之前預想的要少,英偉達股價週一上午下跌逾 15%。其他美國科技股也出現下跌。

Pictet Asset Management 首席策略師 Luca Paolini 表示:“雖然 [DeepSeek R1] 對用戶和全球經濟來說是個好消息,但對美國科技股來說卻是個壞消息。在估值和增長預期非常高的情況下,這可能會導致人工智能資本投資名義上縮減,並給利潤率帶來壓力。”

但美國科技還沒有失敗——至少現在還沒有。

目前,OpenAI 的“o1 Pro”模型仍被認爲是世界上最先進的。然而,DeepSeek R1 的表現確實表明,中國比以前想象的更接近人工智能的前沿,開源模型已經趕上了閉源模型。

對於 OpenAI 和谷歌等閉源模型公司來說,更令人擔憂的可能是 DeepSeek 向消費者收取的費用——或者說,費用太低了——以訪問其最先進的模型。OpenAI 對其最先進的模型 o1 輸出的每百萬個“token”(即詞段)收取 60 美元。相比之下,DeepSeek 對 R1 輸出的相同數量 token 收取 2.19 美元——幾乎低了 30 倍。

與美國政府密切合作的人工智能公司 Gladstone AI 的首席技術官愛德華·哈里斯 (Edouard Harris) 表示:“它侵蝕了工業基礎,侵蝕了利潤,削弱了私人資本進一步投資西方(人工智能)擴張的動力。”

…但是 Deepseek 是透明的嗎?

DeepSeek 的成功更具爆炸性,因爲它似乎讓人質疑美國政府通過限制向中國出口強大芯片或 GPU 來限制其人工智能戰略的有效性。如果 DeepSeek 的說法屬實,則意味着儘管存在這些限制,中國仍有能力創建強大的人工智能模型,這凸顯了美國戰略的侷限性。

DeepSeek 聲稱,其制約因素是芯片,而不是資金或人才。該公司表示,其僅使用 2,000 塊二級 Nvidia 芯片訓練其 v3 和 R1 模型。DeepSeek 首席執行官梁文峯在 2024 年表示:“錢從來都不是我們的問題。禁止出口先進芯片纔是問題所在。”(美國現行政策禁止向中國出口最先進的 AI 芯片,OpenAI 和微軟使用的美國數據中心就裝有這類芯片。)

但這些說法是真的嗎?

Scale AI 首席執行官Alexandr Wang最近在達沃斯接受CNBC採訪時表示:“據我瞭解,DeepSeek 擁有 50,000 塊 H100 芯片。”H100 是目前市場上性能最高的 Nvidia GPU 芯片。“他們不能公開談論 [這個],因爲這違反了美國實施的出口管制。”(這種規模的 H100 集羣將耗資數十億美元。)

上週一,中國總理李強在北京梁文峯見面,這表明中國對這項技術的重視程度。據報道,在那次會議上,文峯表示,DeepSeek 需要更多芯片。“DeepSeek 只能使用幾千個 GPU,但他們卻成功了,”Gladstone AI 首席執行官傑瑞米·哈里斯 (Jeremie Harris) 表示。“因此,這引出了一個顯而易見的問題:如果他們從政府那裏獲得撥款,全速推進,會發生什麼?”

儘管中國可能用更少的芯片實現了驚人的人工智能能力,但專家表示,更多的計算能力將始終是一種戰略優勢。在這方面,美國仍然遙遙領先。喬治梅森大學研究員迪恩·鮑爾說:“擁有更多計算能力永遠不是壞事。無論你擁有多少,你都會使用它。”

這將對美科技競爭產生怎樣的影響?

簡短的回答是:從華盛頓的角度來看,情況尚不確定。

在拜登政府任期即將結束的日子裏,即將離任的國家安全顧問傑克·沙利文 (Jake Sullivan)警告稱,人工智能發展速度是“目前世界上最具影響力的事情”。就在上任幾天後,特朗普總統宣佈成立一個由 OpenAI 和其他公司支持的 5000 億美元新企業,以建設對創造“通用人工智能”至關重要的基礎設施——這是人工智能的下一個飛躍,其系統將足夠先進,能夠取得新的科學突破,以近似科幻小說中描述的那種方式進行推理。

儘管關於美國對中國芯片限制的未來仍存在疑問,但華盛頓的優先事項在特朗普總統上任第一週簽署的人工智能行政命令中顯而易見,該命令宣佈“美國的政策是維持和加強美國在全球人工智能領域的主導地位,以促進人類繁榮、經濟競爭力和國家安全。”

專家表示,保持這種主導地位至少在一定程度上意味着要準確瞭解中國科技公司在做什麼,以及保護美國的知識產權。

Gladstone AI 的愛德華·哈里斯 (Edouard Harris) 表示:“DeepSeek 和許多其他中國大公司很有可能得到了中國政府的支持,而不僅僅是資金方面的支持。”他還建議美國人工智能公司加強安全措施。

人工智能將走向何方?

自 12 月以來,OpenAI 的新 o1 和 o3 模型打破了人工智能模型難以通過的高級推理測試的記錄。

DeepSeek R1 做了類似的事情,在這個過程中體現了許多研究人員所說的範式轉變:研究人員不是擴大用於訓練模型的計算能力,而是擴大模型在回答問題之前思考響應的時間(以及計算能力和電力)。研究人員稱之爲“測試時間計算”的這種擴展將新一類“推理模型”(如 DeepSeek R1 和 OpenAI 的 o1)與不太複雜的前輩區分開來。許多人工智能研究人員認爲,在這種範式達到極限之前,還有很大的發展空間。

一些人工智能研究人員認爲,DeepSeek 的 R1 取得了與 DeepMind 的 AlphaZero 同等水平的突破,AlphaZero 是 2017 年推出的模型,它通過純粹與自己對弈而不斷提高,而不是觀察任何人類遊戲,從而成爲國際象棋和圍棋棋盤遊戲中的超人。

這是因爲R1 並沒有像其他領先的 LLM 那樣對人工標記的數據進行“預訓練”。

相反,DeepSeek 的研究人員找到了一種方法,讓模型從頭開始引導自己的推理能力。

他們表示:“我們不需要明確地教導模型如何解決問題,而只需爲其提供適當的激勵,它就會自主開發出先進的解決問題的策略。”

這一發現意義重大,因爲它表明,只要應用更多的計算能力,強大的人工智能能力可能會以比以前想象的更快的速度出現,而且所需的人力更少。“DeepSeek R1 就像是這種擴展範式的 GPT-1,”Ball 說。

最終,中國最近在人工智能領域的進步非但不會取代美國的地位,反而可能是一個重新排序的開始——換句話說,這是一個向未來邁出的一步,未來不再是一個霸權國家,而是多個人工智能力量中心相互競爭。

OpenAI 前政策工作人員 Miles Brundage 在 X 上寫道:“除非發生戰爭,否則中國在一年之內也會擁有自己的超級智能,比美國晚不到一年。所以,除非你想要(發生戰爭),由多個國家共同發展的多極化人工智能格局似乎是必然的。”

原文鏈接:https://time.com/7210296/chinese-ai-company-deepseek-stuns-american-ai-industry/
說明: 比推所有文章只代表作者觀點,不構成投資建議
AI專題DeepSeekMetaOpenAI亞馬遜人工智能微軟硅谷科技巨頭谷歌
相關新聞
  • Deepseek超ChatGPT登頂AppStore第一,相關AI概念幣有哪些?
  • DeepSeek引發AI Agent板塊大洗牌?現在是該抄底還是撤退
  • DeepSeek火了,Crypto市場崩了?
  • Bankless:加密技術如何成爲 AI Agents 的超級燃料
  • 深度解讀:Aethir如何促進AI+Crypto快速發展

免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。

熱議股票

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10