解密DeepSeek:關於中國AI初創企業崛起的5個誤解與現實

鞭牛士Bianews
02-03

鞭牛士報道,2月3日消息,據印度媒體報道,在中國人工智能初創公司發佈其推理模型 R1 幾天後,DeepSeek 繼續受到科技行業高管和立法者的一致好評,這引發了從紐約到東京等市場科技股的大規模拋售。

R1 模型的質量和成本效益是 DeepSeek 人氣飆升的主要原因。該公司聲稱,其 AI 模型在性能上可與 OpenAI 的 o1 推理模型相媲美,在某些情況下甚至超過後者,同時使用更少的圖形處理單元 (GPU),成本也低得多。

DeepSeek 的聊天機器人應用程序可免費訪問 R1,已在多個國家/地區的應用商店排行榜上名列前茅。然而,一些人對該公司的成功持謹慎和懷疑態度。OpenAI 指責 DeepSeek 竊取知識產權,並表示有證據表明該公司使用其 GPT 模型來訓練自己的模型。

毋庸置疑,DeepSeek 的熱情正在逐漸被審視所取代,人們開始質疑其 AI 模型是如何開發的,以及對其更廣泛影響的各種解釋。隨着討論的展開,讓我們來揭穿一些圍繞 DeepSeek 崛起的常見誤解。

誤解 1:DeepSeek 的 AI 模型表明 AGI 觸手可及

現實:DeepSeek 的 AI 模型在效率和成本方面有顯著的提升,但並不一定預示着向通用人工智能 (AGI) 的飛躍。

AGI 是科技行業用來描述能夠在各種任務上匹敵或超越人類智力的 AI 模型的術語。目前還沒有人宣佈他們已經開發出這樣的 AI 模型。然而,OpenAI 及其一些競爭對手錶示,他們正熱切地致力於實現 AGI 里程碑。

據報道,2023 年,DeepSeek 從中國對沖基金 High-Flyer 的 AI 研究部門發展成爲一家 AI 公司。該公司由對沖基金經理梁文峯創立,目標是在通往 AGI 的道路上開發大型語言模型 (LLM)。

OpenAI 首席執行官 Sam Altman 曾多次表示,ChatGPT 的開發者將有信心實現 AGI。在回應 DeepSeek 的炒作時,Altman 再次將焦點轉移到 AGI,同時稱讚 R1 模型令人印象深刻。

儘管 R1 標誌着 AI 霸權之爭的轉折點,但 DeepSeek 並未引入全新技術。紐約大學 (NYU) 教授兼 AI 專家 Gary Marcus 向 CNBC 表示:實現 AGI 可能還需要五六個突破,能夠率先實現這些突破的公司或國家可能會獲勝。

誤解二:DeepSeek 的突破錶明出口管制不起作用

現實:美國對先進 GPU 銷售的出口限制可能會繼續對中國的人工智能發展產生重大影響。

DeepSeek 的突破被認爲是美國出口管制的意外結果,美國出口管制限制中國科技公司購買先進的 GPU 來擴展其 AI 模型。據報道,由於無法使用 Nvidia 的頂級芯片,DeepSeek 研究人員被迫想出巧妙的方法,使 AI 模型在原始計算能力消耗方面更加高效。

批評人士認爲,美國的出口管制適得其反,但據報道,在貿易限制實施之前,DeepSeek 就儲存了 10,000 塊 Nvidia 老一代 A100 GPU。

最近離開 OpenAI 的人工智能政策專家 Miles Brundage 表示,出口管制可能仍會阻礙中國開展更多人工智能實驗和構建人工智能代理的步伐。

“DeepSeek 迫於形勢,不得不尋找一些可能比美國公司更快的技術。但這並不意味着他們不會從擁有更多 [GPU] 中受益。這並不意味着他們能夠像 OpenAI 那樣立即從 o1 跳到 o3 或 o5,因爲他們擁有更龐大的芯片羣。”Brundage 在最近的播客採訪中說道。

此外,Claude系列人工智能模型背後的公司Anthropic的首席執行官Dario Amodei表示,DeepSeek的成果使得出口管制政策比一週前變得更加重要。

誤解三:DeepSeek 對 Nvidia 構成嚴重威脅

現實:DeepSeek 的 R1 模型對 Nvidia 來說可能並不像有些人想象的那麼令人擔憂。

DeepSeek 的熱議引起了 Nvidia 投資者的恐慌,導致其股價在 1 月 27 日下跌 17%,市值蒸發近 6000 億美元。這家芯片巨頭的股價從 1 月 28 日的大幅下跌中恢復過來,但在 1 月 29 日又下跌了 4%。

雖然 DeepSeek 的 R1 模型可能減少了對 Nvidia 等公司大量專用 AI 硬件的需求,但這並不意味着這家芯片巨頭將走向滅亡。

微軟首席執行官薩蒂亞·納德拉指出,DeepSeek 的影響可能會增加對高級 GPU 的需求,這反常識。“傑文斯悖論再次來襲!”納德拉在 X 上的一篇文章中寫道。

傑文斯悖論是一種經濟理論,它表明當技術進步使資源的利用更加高效時,該資源的總體消耗往往會增加。

科技投資者 Andrew Ng 也表示,DeepSeek 的結果是否會減少對 GPU 和計算能力的需求還有待觀察。他在 X 上的一篇文章中表示:有時,讓每單位商品更便宜,可以帶來更多美元用於購買該商品。

誤解四:DeepSeek R1 是一個完全開源的模型

現實:DeepSeek R1 可以免費下載、修改和重複使用,但它可能不被視爲真正的開源。

DeepSeek R1 的出色成績被許多人解讀爲中國在 AI 霸主地位爭奪戰中領先於美國的標誌。但除了地緣政治角度之外,DeepSeek 的成功也被視爲開源 AI 戰勝封閉 AI 的標誌。

Meta 首席人工智能科學家 Yann LeCun 對此表示贊同:DeepSeek 受益於開放研究和開源(例如 Meta 的 PyTorch 和 Llama)。他們提出了新的想法,並在其他人的工作基礎上構建了這些想法。因爲他們的工作是公開的和開源的,所以每個人都可以從中受益。這就是開放研究和開源的力量。

R1 的底層模型架構和權重(用於指示 AI 模型如何處理信息的數值)已在寬鬆的 MIT 許可下公開。這意味着該模型可以不受限制地部署。

但 R1 並不符合廣泛接受的開源定義。根據開放源代碼促進會 (OSI) 的規定,真正的開源 AI 模型必須提供有關用於訓練 AI 的數據、用於構建和運行 AI 的完整代碼以及訓練中的設置和權重的詳細信息。

用於訓練 R1 的數據尚未公開。訓練代碼和其他訓練說明也尚未提供。開源 AI 開發人員通常對發佈訓練數據集持謹慎態度,因爲這可能會引發侵犯版權的訴訟。

誤解五:DeepSeek 的 AI 模型存在額外的隱私風險

現實:DeepSeek 的 AI 與其他 LLM 一樣,對隱私構成同樣的風險

DeepSeek 的迅速崛起也引發了用戶和政府對數據隱私的擔憂。其中一些擔憂源於這家人工智能初創公司的中國背景,而另一些人則指出了其人工智能技術的開源性質。

DeepSeek 在其隱私政策中明確表示:我們將收集的信息存儲在位於中國的安全服務器中。

然而,Perplexity 首席執行官 Aravind Srinivas 等科技行業人士曾多次試圖緩解這種數據保護擔憂,他們指出 DeepSeek 的 R1 模型可以下載並在筆記本電腦或其他設備上本地運行。運行本地實例意味着用戶可以私下與 DeepSeek 的 AI 進行交互,而公司不會獲取輸入數據。

Srinivas 表示,Perplexity 託管的 R1 模型位於美國和歐盟的數據中心,而不是中國。他還聲稱,Perplexity 託管的 R1 版本不受審查限制。

免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。

熱議股票

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10