文| 源媒匯 謝春風
DeepSeek幾乎承包了今年春節期間的大半熱度。
截圖來源於DeepSeek官網
國產AI獨角獸DeepSeek的意外出圈,令其創始人梁文鋒的家鄉——廣東湛江吳川覃巴鎮米歷嶺村吸引了衆多遊客前往“打卡”。甚至還有建築風水師拿着羅盤,研究起米歷嶺村的房屋佈局和梁文鋒的家宅佈局。
一時間,科技與玄學巧妙“相融”。
在國內大廠以及國際巨頭紛紛傾力押注AI大模型的市場背景下,DeepSeek,這家由量化私募公司幻方量化(下稱“幻方”)孵化的大模型公司,團隊核心成員僅百餘人,沒有鋪天蓋地的發佈會,卻以“能用、好用、用得起”的口碑悄然滲透市場。
DeepSeek的崛起,不僅曾引發美國科技股的大幅下跌,甚至迫使行業掀起價格戰。
而梁文鋒本人更因豪捐上億善款、拒絕資本裹挾的姿態,成爲中國AI領域的一股清流。
01一場“沉默”的技術革命
與多數AI公司依賴資本“造勢”不同,DeepSeek的春節走紅充滿“草根性”。
主要體現在兩個方面:
第一,技術下沉。例如,DeepSeek開源的7B小模型,在英特爾至強CPU上即可運行,讓縣城中學能用老舊機房開展AI教學,甚至縣城程序員用它調試代碼。此外,DeepSeek開源的數學推理模型,更被中小科技公司接入業務系統;
第二,極致性比價。例如,DeepSeek-R1和DeepSeek-V3等模型的API調用價格低至0.14元/萬token,僅爲行業均價的1/20。河南某農產品電商,藉此將智能客服成本壓縮92%。
支撐DeepSeek“極致性價比”的,是幻方從量化交易中淬鍊出的生存哲學——自研“動態計算圖”技術,讓同一批GPU可並行訓練3個模型,硬件利用率達89%,遠高於行業平均水平;訓練數據清洗引入量化風控模型,將無效數據標記率提升至93%,百億參數模型訓練成本控制在800萬元內。
不同於大廠執着於萬億參數競賽,DeepSeek專注提升“單位算力產出效率”。其13B參數模型在法律文書審覈場景擊敗多家千億級大模型,核心在於對合同條款、行業術語的精準理解——這源於幻方量化團隊多年處理金融法律文本的經驗遷移。
此外,梁文鋒堅持“用量化交易的錢養AI研發”。其曾表示,作爲出資人之一的幻方,有充足的研發預算,另外每年有幾個億的捐款預算,之前都是給公益機構,如有需要亦可做調整。同時,還有分析稱,幻方將每年淨利潤的90%投入技術攻堅,團隊成員甚至自願將年終獎轉爲研發基金。
這種模式,避開資本對短期回報的追逐,但也暗藏風險——2023年A股波動導致幻方研發資金同比減少18%,團隊不得不暫停兩個長期項目。
02第一桶金與“不差錢”的底氣
2016年成立的幻方,最初只是杭州一家低調的量化私募基金,團隊不足20人,卻憑藉AI算法在二級市場屢創收益神話。
幻方的財富密碼始於量化交易。梁文鋒團隊早年開發出一套基於機器學習的高頻交易系統,在2015年A股波動中逆勢斬獲300%年化收益,迅速積累數十億資本。
至2022年,幻方管理規模突破千億,成爲亞洲最大量化私募之一。同年,幻方和員工向慈善機構捐贈共計約3.6億元,其中一名員工以個人名義捐贈1.38億元。該捐贈人也被外界鎖定爲梁文鋒。
圖片來源:幻方量化公衆號
“不差錢”的梁文鋒,甚至多次公開表示:“幻方不需要融資,我們賺的錢足夠養活創新。”
之後,梁文鋒團隊將量化領域的AI技術積累遷移至大模型賽道,成立DeepSeek,僅用3年時間便衝至全球大模型競技場第二梯隊,與谷歌、Meta同臺競技。
天眼查顯示,杭州深度求索人工智能基礎技術研究有限公司(下稱“深度求索”)成立於2023年,由寧波程恩企業管理諮詢合夥企業(有限合夥)和梁文鋒分別持股99%和1%,而前者亦爲梁文鋒控股公司。
DeepSeek運營主體便是深度求索。
相較於OpenAI數千人的團隊和百億美元投入,DeepSeek核心團隊僅百餘人,研發成本不足行業巨頭的1/10。其開源模型DeepSeek-Math在GSM8K數學推理測試中超越GPT-4,而API價格僅爲GPT-4的1/50。這種“極致性價比”直接衝擊市場,倒逼阿里、百度等大廠降價應戰。
DeepSeek崛起背後,是近乎“瘋狂”的技術投入。
曾被小米創始人雷軍以千萬年薪招攬的DeepSeek開源大模型DeepSeek-V2的關鍵開發者之一,被譽爲“天才AI少女”的羅福莉,曾直言:“在幻方,技術理想比商業回報更有吸引力。”
DeepSeek的崛起,側面反映出國產芯片行業的當前困局。
03中國需要100個DeepSeek
“中國AI芯片的問題不在製程,而在生態。”
“如果我們能讓國產芯片的算法效率提升30%,就能撕開一道口子。”
在近期央視訪談中,梁文鋒如是談到。
爲了規避英偉達限制,DeepSeek使用華爲升騰910B訓練模型,但算子兼容性問題導致訓練效率降低40%,團隊不得不用30%工程師人力開發轉換工具。對此,梁文輝認爲,這原本該是芯片廠商的工作。
此外,也有業內觀點認爲,如果中國AI只能在英偉達芯片和OpenAI論文基礎上修修補補,這不過是另一種形式的代工。
當多數公司焦慮“何時做出中國版GPT-4”時,幻方用數學思維重新定義競爭維度——不做參數規模的奴隸,而是深耕“輸入1度電,產出10倍智能”;
當行業沉迷資本故事時,幻方證明,用量化交易的“快錢”支撐硬核科技的“慢研發”,並非天方夜譚;
當全球追逐通用人工智能(AGI)聖盃時,中國或許更需要1000個深度改造製造業、農業、小微企業的“專用智能”。
春節假期結束第一天,DeepSeek社區出現一條高贊留言:“我們縣城程序員用你的模型接了三個訂單,養活了一個五人小團隊。”這或許纔是中國AI最真實的生命力——不在融資新聞的頭條裏,而在無數普通人用技術改善生活的細節中。
當全球AI陷入千億美金“軍備競賽”時,梁文鋒與幻方提供了一種反主流敘事——用數學家的極致理性、工程師的務實創新,以及近乎偏執的成本控制,證明“聰明資本”與“技術理想主義”可以共存。
這或許正是中國AI破局的關鍵密碼:不需要另一個OpenAI,而是需要100個DeepSeek。
冷峻又務實,或爲國產AI的未來。
免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。