來源:洞見學堂
作者:王勇、鄧懷宇
導讀
2025年開年之際,中國AI公司DeepSeek以遠低於衆多科技巨頭的訓練成本、顛覆性的底層架構創新,一躍成爲國內外無法忽視的人工智能“新生力量”,引發了全球範圍內的廣泛關注。我們注意到DeepSeek創始人梁文鋒作爲一個連續創業者,其企業經營管理經驗、對創新(技術、生態、組織、人才等)的深度認知,在DeepSeek的異軍突起中發揮了關鍵作用。
一、堅信人類智能與AGI之間並非不可跨越
DeepSeek的誕生,與創始人梁文鋒十餘年的創業經歷和創新思考緊密相連。在浙江大學攻讀電子工程及人工智能方向時,梁文鋒就堅信人類智能與通用人工智能(AGI)之間並非不可跨越。
梁文鋒對AGI的技術追求最開始體現在量化投資領域。2008年,研究量化對沖;2015年創立幻方量化(High-Flyer),運用AI驅動策略交易,使幻方量化一度躋身國內量化私募四巨頭之一。
2023年,梁文鋒決定將多年在AI方面的研究經驗,從量化投資場景拓展至更廣闊的大模型領域,並於7月正式成立DeepSeek,專注於大模型與通用人工智能研究。
在許多AI創業者急於將產品變現的環境下,梁文鋒依然堅持以AGI爲最終目標,他認爲當前多種生成式AI應用產品的出現,僅僅是邁向通用智能的過渡階段,對於DeepSeek來說,在這一進化歷程中,對AGI的好奇與探索比商業回報更具驅動力。他在採訪中直言:“這一波大模型浪潮只是起跑線,AGI並非遙不可及,我們這代人很可能就能見證。”因此,DeepSeek從創立之初便選擇研究優先,暫緩直接面向C端的應用產品落地,與“快變現、搶市場”的AI創業主流趨勢形成鮮明對比。
二、注重技術投入,敢於在競爭激烈的市場中選擇差異化技術路線
DeepSeek當前取得的技術突破,離不開前幾年梁文鋒創立幻方量化時在人工智能技術上的鉅額投入。據報道,幻方量化自2019年起持續加大在人工智能相關基礎設施和算力方面的投入:從最初搭載1000多塊GPU、耗資近2億元的“螢火一號”,到2021年擁有上萬塊英偉達A100顯卡、耗資逾10億元的“螢火二號”,幻方量化由此成爲國內少數擁有大規模算力的金融機構。彼時外界對此尚不理解,但梁文鋒強調:“AI的三大核心要素之一就是算力,越早投入,越能催生更多原創技術火花。”
不僅如此,梁文鋒對技術創新有其獨特的追求,敢於在競爭激烈的市場中選擇差異化技術路線,由此實現底層訓練邏輯和底層架構上的顛覆性創新。
DeepSeek在2024年底至2025年初發布的R1系列模型,尤其是R1-Zero,首次大規模驗證了純強化學習在大模型訓練中的可行性。不同於此前大模型對複雜神經網絡獎勵、監督學習以及人類示例的高度依賴,DeepSeek僅用極簡的獎勵規則,就能讓大模型在自然語言推理和數學推理領域通過自我博弈與原始獎懲信號不斷頓悟與自適應調整。美國艾倫人工智能研究所研究員Nathan Lambert稱:“DeepSeek R1-Zero在推理層面開啓了一個重要轉折點,可謂純RL推動大模型的‘開山之作’。”
除了顛覆性的底層訓練邏輯外,DeepSeek還在底層架構上開創了全新的MLA(多頭潛在注意力機制)和DeepSeekMoESparse結構。儘管注意力機制已提出多年,但很少有企業敢於在激烈的市場競爭下大規模改動其核心架構,大多數企業傾向於沿用GPT、Llama等成熟架構進行穩健迭代。而DeepSeek反其道而行之,選擇差異化底層架構路線,直接將顯存佔用壓縮至傳統多頭注意力(MHA)架構的個位數百分比,使推理成本比競品低了7至10餘倍,成功實現了大幅度的成本削減,帶動整個大模型產業鏈的服務成本迅速降低。
三、通過開源建立商業生態影響力,打造創新合力
OpenAI自GPT-4起不斷強化閉源策略,國內不少大廠也傾向於將關鍵技術封裝進雲服務。與之相反,DeepSeek堅持“開源 + 生態共建”策略,以極具競爭力的API定價讓用戶廣泛受益。如今,國內許多雲廠商、AI創業公司及中小企業都能以較低成本使用DeepSeek推理模型,正如DeepSeek的願景所說:“讓更多人真正用得起AI”。DeepSeek也因開源在國際AI圈引發了極大關注並獲得了廣泛的尊敬。據相關報道,Meta、Anthropic等海外AI巨頭團隊都在研究或借鑑其部分架構創新。甚至有美國學者將“OGOpenAI.com”域名定向至DeepSeek,以表達對其開放精神的敬意。
在梁文鋒看來,閉源或許短期內能幫助企業形成競爭優勢,但要在更長週期內激發社會層面的創新合力,必須讓更多研究者和創業者能夠以低門檻使用底層大模型。當然,DeepSeek開源也並非“賠本賺吆喝”。通過提供規模化服務,DeepSeek得以持續優化其底層結構,從而更好地爲用戶提供優質的大模型服務,進而吸引更多的用戶融入DeepSeek商業生態,不斷拓展DeepSeek商業生態的邊界。這不僅確保了DeepSeek能夠長久保持可觀收益,還促進了推動整個人工智能行業的進步與發展。
四、信任年輕人,相信熱愛、好奇與自由能夠打破經驗的路徑依賴
在引發全球轟動後,DeepSeek的研發團隊備受關注。令人驚訝的是,其核心團隊幾乎全是應屆畢業生和工作兩三年的研究員。創始人梁文鋒多次表示:“本土年輕人才一樣可以做到世界一流。”
DeepSeek在發展過程中並不急於從海外聘請明星級專家,而是大量招聘應屆生、博士生或畢業不久的研究員,爲他們提供充足的資源與獨立立項權。只要能證明思路可行,任何員工都可調動海量GPU算力進行大規模訓練,也可以跨小組自由組隊攻關。一些新入職數月的年輕人,就迅速成長爲項目技術負責人,並在實踐中迸發出全新的思路。
在梁文鋒的帶領下,DeepSeek相信純粹的熱愛和內在好奇心往往能打破經驗的路徑依賴。據內部員工透露,DeepSeek內部工作氛圍“極度自由”,更少官僚文化和KPI 壓力,更注重鼓勵每個人“做自己想做的研究”。正如梁文鋒所言:“創新往往不是被安排出來的,更不是KPI考覈教出來的,而是源自自下而上的熱愛與奇思。”
此外,DeepSeek在組織層面幾乎沒有明確的行政層級。早在量化投資時期,團隊就已形成“反層級”基因,在大模型階段更是沒有部門邊界:每個人既是工程師,也是研究員;管理者的主要職能是在當一個Idea顯示出潛力時,自上而下地去調配資源。而梁文鋒作爲老闆依舊每日深入一線,每天都在寫代碼、跑代碼,甚至身邊同事評價梁文鋒:完全不像一個老闆,而更像一個極客。
小結
DeepSeek的出現並非偶然,憑藉梁文鋒對AGI前景的堅定信心、對技術創新的尊重、對商業生態的理解、對青年人才的信任,其迅速成爲全球AI界的焦點。無論是低成本高效率的技術路線,還是開源普惠的生態理念,都在激發行業對大模型新範式的再思考。DeepSeek的故事還在繼續,留給外界的問題是:中國AI能否藉此契機迎來更多自發湧現的硬核創新,中國企業在0-1的問題上能否取得更大的突破?我們拭目以待。
責任編輯:楊賜
免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。