壓力給到梁文鋒

中國企業家雜誌
04-17

作者:閆俊文,編輯:張曉迪,題圖來自:視覺中國

這兩天,中美大模型公司各有大事發生。

4月15日凌晨,OpenAI發佈了GPT-4.1系列模型,包括GPT-4.1、GPT-4.1 Mini、GPT-4.1 Nano,它們的核心特徵是成本更低,速度更快;同一天,另一家中國明星AI公司,智譜AI正式啓動上市輔導備案,中金公司擔任輔導機構。備案報告顯示,智譜AI將在今年8月至10月完成IPO輔導計劃。

此前的3月底,智譜AI CEO張鵬曾告訴《中國企業家》,他判斷實現AGI,路程還長,“不管我們融了多少錢,其實都是AGI道路上的盤纏,未來,還需要更多盤纏,我們會持續地做相關的事情”。

如今看來,這個“更多的盤纏”就是指IPO。

2025年開年,DeepSeek“燃爆”AI圈,目前,截至R1模型正式發佈已經過去86天。

DeepSeek和梁文鋒的團隊什麼時候推出新的大模型產品,尤其是R1的更新版?

《中國企業家》統計了國外Anthropic、Meta等公司更新大模型的週期,如果是模型的重大升級,週期在5至10個月左右;而同一版本的功能升級則在3至4個月之間。

根據DeepSeek官網數據,梁文鋒的AI團隊更新產品與國外主流公司同頻,2024年9月發佈V2.5,12月發佈V3,2025年3月將V3更新爲V3-0324版本,也幾乎每隔3個月就會迎來一次升級。

有一些預測認爲,DeepSeek下一次更新R1模型可能是在5月初,屆時或提前發佈,但DeepSeek方面目前還尚未對這種預測進行回應。

OpenAI也在追求更小更快

公開資料顯示,GPT-3的參數規模爲1750億,GPT-4的參數規模爲1.76萬億,到了GPT-4o參數約2000億規模,此次OpenAI推出的GPT-4.1 Mini,被稱作OpenAI的高效小型模型,在多個基準測試中表現超越GPT-4o,大幅減少延遲並降低83%成本。

GPT-4.1 Nano被稱之爲首個超小型模型,它能支持100萬token的上下文窗口,適用於低延遲任務,如分類和自動補全。

值得注意的是,上述三個模型將上下文窗口處理的規模從GPT-4o的128K直接提升至100萬token(1M)。這意味着模型在更長的文本中保持專注和理解的能力得到了強化。

具體到成本、價格方面,GPT‑4.1比GPT‑4o便宜26%,輸入、輸出分別是每百萬token2美元和8美元;GPT‑4.1 Nano輸入、輸出分別爲0.1美元和0.4美元。

對比DeepSeek,標準時間段內,V3模型輸入、輸出百萬token的費用爲0.5元、8元,R1推理的費用分別爲1元和16元。

可以說,OpenAI也打上了token的價格戰,價格直接對標DeepSeek。

與此同時,OpenAI已暫停了其此前2月發佈的GPT-4.5,原因在於成本太高,其API定價爲輸入、輸出每百萬token75美元、150美元。官方回應說此次調整旨在將更多資源投入未來模型的研發。

關於開源,OpenAI的CEO山姆·阿爾特曼不得不走向與DeepSeek同樣的路徑,他曾表示,DeepSeek的出現並未影響GPT的增長,OpenAI將推出更好的開源模型。

不過,在DeepSeek衝擊之下,阿爾特曼曾經一度非常惱火,甚至恐慌,他曾在社交平臺上指責R1模型使用了GPT的數據蒸餾,又寫公開信給美國政府,聲稱限制AI技術流向中國等國家,並禁用DeepSeek。

但這並不影響DeepSeek的影響力。在英偉達的2025GTC開幕主題演講會上,黃仁勳數次提到R1模型,並用R1模型驗證了黃仁勳所謂的“推理越多,所需算力越多”的說法。

除了OpenAI,谷歌在4月9日也舉辦了發佈會,宣佈推出Agent2Agent智能體交互協議,該協議允許生態系統中的AI智能體進行底層技術無關的相互操作。多個智能體的協作將帶來更高的自主性,同時成倍提高生產力、降低長期成本。

梁文鋒的主場時間又快到了

在R1模型“爆火”之後,DeepSeek除了模型升級,人事佈局上動作頗多,DeepSeek官網在3月份發佈了招聘CFO、COO、財務負責人崗位的信息。這也被一些媒體解讀爲DeepSeek在爲融資做準備;模型方面,DeepSeek最大的動作是3月25日發佈了V2模型的更新版。

目前,DeepSeek並未發佈有關融資方面的信息。4月3日,梁文鋒和團隊發表了一篇論文,題目是《通用獎勵建模的推理時間縮放》,文章論述瞭如何讓注意力機制更高效地處理更長的上下文等。

DeepSeek“燃爆”AI圈後,外界對其充滿好奇和新的期待。潞晨科技CEO尤洋近期在接受《中國企業家》採訪時說,如果有機會跟梁文鋒面對面,他最想問梁文鋒的是他最終的目標是什麼,“梁文鋒是想做一個成功的商業化公司,還是想通過一些其他手段做一些非盈利的事情?這兩者肯定差距是非常大的,OpenAI可能還是想做一個Google那樣的非常高價值的商業化公司。”

記者瞭解到,目前,無論是杭州本地的大公司,還是深圳的頂級創投,都難見梁文鋒一面。

近期英偉達公開表示,美國政府正在限制其H20芯片向中國的出口,並且H20芯片對華出口需要獲得許可證,這一要求是“無限期”。

而H20芯片正是梁文鋒最在意的“基礎設施”,早先,梁文鋒在接受媒體採訪時說,“我們真正的挑戰從來不是資金,而是高端芯片的出口禁令。”

不過,面對禁令,梁文鋒也並非坐以待斃,他曾在接受媒體採訪時說,“英偉達的GPU沒有什麼神祕之處,但要趕上他們,就必須重建團隊、付出時間和成本,追趕下一代技術——這纔是真正的護城河。”

免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。

熱議股票

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10