更正:因譯文有誤,內文DeepSeek創始人姓名爲"梁文鋒",非"梁文峯"
DeepSeek可能在 5 月前發佈下一代 R2 模型--消息
該初創企業以扁平化管理架構聞名,避免了中國科技巨頭的通病
監管部門起初對大規模購買芯片的行爲感到擔心,現已對DeepSeek認可
公司被要求保持低調,因全球對其隱私保護措施不放心
路透北京/香港/新加坡2月25日 - DeepSeek 希望將自己的優勢發揮到極致。
上個月,這家中國初創公司推出了一款價格低廉的人工智能推理模型,其表現優於許多西方同類產品,引發了全球股市1萬多億美元的拋售。
據三位熟悉情況的人士透露,這家總部位於杭州的公司繼1月推出R1模型後,現正在加快推出後續產品。
其中兩人說,Deepseek 原計劃在 5 月初發布 R2,但現在希望儘早推出,不過兩位人士沒有提供具體細節。
該公司表示,希望新模型能生成更好的編碼,並能用英語以外的其它語言進行推理。關於加快 R2 發佈的具體時間表,此前沒有過報道。
DeepSeek 沒有回應關於本報道的置評請求。
競爭對手仍然沒有從R1的震撼中恢復,雖然 R1採用並非尖端的Nvidia芯片,但與美國科技巨頭耗資數千億美元開發的芯片相比,仍具有競爭力。
R2可能讓美國政府感到擔憂,因爲美國已將在人工智能發展中處於領先作爲優先事項。R2的發佈可能會進一步刺激中國政府和企業,有數十家中國公司表示已開始將 DeepSeek 模型集成到它們的產品中。
人們對DeepSeek公司知之甚少,其創始人梁文鋒通過創建量化對沖基金幻方(High-Flyer)成爲億萬富翁,但他被一位前僱主形容爲 "低調、內向",自 2024 年 7 月以來,他未接受過任何媒體採訪。
他早期有一份工作是在上海一家智能影像處理公司負責研究部門。他當時的老闆周朝恩2 月 9 日接受國家媒體採訪時稱,梁文鋒聘請那些獲獎的算法工程師,並以 "扁平化管理風格 "進行運作。
在DeepSeek和幻方,梁文鋒都避開了中國科技巨頭的通病,即採用自上而下的僵化管理方法,給年輕員工低薪和"996"工作制。
去年9月離開公司的26歲研究人員Benjamin Liu表示,梁文鋒給了他們更多的掌控權,把他們當作專家對待。
梁文鋒沒有回答通過 DeepSeek 發送的問題。 他去年曾告訴中國自媒體《暗湧Waves》,他刻意避免在應用開發上花費巨資,而是專注於完善人工智能模型的品質。
據三位熟悉 DeepSeek 和幻方薪酬慣例的人士稱,這兩家公司都以薪酬豐厚聞名。來自競爭對手的一位熟悉梁文鋒的量化基金經理說,在幻方,資深數據科學家年薪達到150萬元人民幣並不罕見,而競爭對手給的年薪很少超過80萬。
據兩位業內人士稱,幻方是中國最成功的量化基金之一,即使在政府進行行業整頓後,仍然管理着數百億元人民幣的資金。
**獲得國家認可**
2020 年和 2021 年,幻方斥資 12 億元購買了兩個超級計算 AI 集羣。第二個集羣 "Fire-Flyer II "由約 1 萬塊Nvidia A100 芯片組成,用於訓練人工智能模型。
一位直接瞭解官方想法的人士說,DeepSeek 當時尚未成立,因此積累這麼高的計算能力引起了中國證券監管機構的注意。
"監管部門想知道,他們爲什麼需要這麼多芯片?"這位人士說,"他們打算如何使用這些芯片?這會對市場產生什麼樣的影響?"
當局決定不予干預,此舉對 DeepSeek 的命運至關重要:美國在 2022 年禁止向中國出口 A100 芯片時,Fire-Flyer II 已經投入使用。
一位熟悉中國官方想法的人士說,中國政府現在爲 DeepSeek 慶功,但指示它未經批准不得與媒體接觸。
該人士說,當局要求梁文鋒保持低調,因爲他們擔心媒體過多的炒作會引起不必要的關注。
中國國務院和商務部以及中國證監會沒有回應置評請求。
甚至在 R1 引起全球關注之前,就有跡象表明 DeepSeek 已經獲得了中國政府的青睞。今年 1 月,據國家媒體報道,梁文鋒作爲人工智能行業的代表,在北京受到中國總理李強的接見。
隨後,對其模型成本競爭力的大加宣揚,讓中國政府更加相信自己可以超越美國,中國企業和政府機構以其他公司無法企及的速度採用了DeepSeek 模型。
中國至少有 13 個市政府和 10 家國有能源公司表示,已在其系統中部署了 DeepSeek,同時科技巨頭聯想 0992.HK 、百度 9888.HK 和騰訊 0700.HK 也已將 DeepSeek 的模型集成到其產品中。
不過,從韓國到意大利的多國政府以隱私爲由,將 DeepSeek 從本國應用商店中下架。
"如果DeepSeek成爲中國國家實體普遍首選的人工智能模型,西方監管機構可能會覺得,更有理由升級對人工智能芯片或軟件合作的限制,"人工智能專家、對沖基金Carthage Capital創始人Stephen Wu說。
梁文鋒承認,進一步限制先進人工智能芯片是一個挑戰。
"我們的問題從來都不是資金,"他在去年7月告訴《暗潮Waves》,"問題在於對高端芯片的禁運"。(完)
(編審 鄭茵)
((yin.zheng@thomsonreuters.com; 010-56692086;))
免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。