文| 源媒汇 谢春风
DeepSeek几乎承包了今年春节期间的大半热度。
截图来源于DeepSeek官网
国产AI独角兽DeepSeek的意外出圈,令其创始人梁文锋的家乡——广东湛江吴川覃巴镇米历岭村吸引了众多游客前往“打卡”。甚至还有建筑风水师拿着罗盘,研究起米历岭村的房屋布局和梁文锋的家宅布局。
一时间,科技与玄学巧妙“相融”。
在国内大厂以及国际巨头纷纷倾力押注AI大模型的市场背景下,DeepSeek,这家由量化私募公司幻方量化(下称“幻方”)孵化的大模型公司,团队核心成员仅百余人,没有铺天盖地的发布会,却以“能用、好用、用得起”的口碑悄然渗透市场。
DeepSeek的崛起,不仅曾引发美国科技股的大幅下跌,甚至迫使行业掀起价格战。
而梁文锋本人更因豪捐上亿善款、拒绝资本裹挟的姿态,成为中国AI领域的一股清流。
01一场“沉默”的技术革命
与多数AI公司依赖资本“造势”不同,DeepSeek的春节走红充满“草根性”。
主要体现在两个方面:
第一,技术下沉。例如,DeepSeek开源的7B小模型,在英特尔至强CPU上即可运行,让县城中学能用老旧机房开展AI教学,甚至县城程序员用它调试代码。此外,DeepSeek开源的数学推理模型,更被中小科技公司接入业务系统;
第二,极致性比价。例如,DeepSeek-R1和DeepSeek-V3等模型的API调用价格低至0.14元/万token,仅为行业均价的1/20。河南某农产品电商,借此将智能客服成本压缩92%。
支撑DeepSeek“极致性价比”的,是幻方从量化交易中淬炼出的生存哲学——自研“动态计算图”技术,让同一批GPU可并行训练3个模型,硬件利用率达89%,远高于行业平均水平;训练数据清洗引入量化风控模型,将无效数据标记率提升至93%,百亿参数模型训练成本控制在800万元内。
不同于大厂执着于万亿参数竞赛,DeepSeek专注提升“单位算力产出效率”。其13B参数模型在法律文书审核场景击败多家千亿级大模型,核心在于对合同条款、行业术语的精准理解——这源于幻方量化团队多年处理金融法律文本的经验迁移。
此外,梁文锋坚持“用量化交易的钱养AI研发”。其曾表示,作为出资人之一的幻方,有充足的研发预算,另外每年有几个亿的捐款预算,之前都是给公益机构,如有需要亦可做调整。同时,还有分析称,幻方将每年净利润的90%投入技术攻坚,团队成员甚至自愿将年终奖转为研发基金。
这种模式,避开资本对短期回报的追逐,但也暗藏风险——2023年A股波动导致幻方研发资金同比减少18%,团队不得不暂停两个长期项目。
02第一桶金与“不差钱”的底气
2016年成立的幻方,最初只是杭州一家低调的量化私募基金,团队不足20人,却凭借AI算法在二级市场屡创收益神话。
幻方的财富密码始于量化交易。梁文锋团队早年开发出一套基于机器学习的高频交易系统,在2015年A股波动中逆势斩获300%年化收益,迅速积累数十亿资本。
至2022年,幻方管理规模突破千亿,成为亚洲最大量化私募之一。同年,幻方和员工向慈善机构捐赠共计约3.6亿元,其中一名员工以个人名义捐赠1.38亿元。该捐赠人也被外界锁定为梁文锋。
图片来源:幻方量化公众号
“不差钱”的梁文锋,甚至多次公开表示:“幻方不需要融资,我们赚的钱足够养活创新。”
之后,梁文锋团队将量化领域的AI技术积累迁移至大模型赛道,成立DeepSeek,仅用3年时间便冲至全球大模型竞技场第二梯队,与谷歌、Meta同台竞技。
天眼查显示,杭州深度求索人工智能基础技术研究有限公司(下称“深度求索”)成立于2023年,由宁波程恩企业管理咨询合伙企业(有限合伙)和梁文锋分别持股99%和1%,而前者亦为梁文锋控股公司。
DeepSeek运营主体便是深度求索。
相较于OpenAI数千人的团队和百亿美元投入,DeepSeek核心团队仅百余人,研发成本不足行业巨头的1/10。其开源模型DeepSeek-Math在GSM8K数学推理测试中超越GPT-4,而API价格仅为GPT-4的1/50。这种“极致性价比”直接冲击市场,倒逼阿里、百度等大厂降价应战。
DeepSeek崛起背后,是近乎“疯狂”的技术投入。
曾被小米创始人雷军以千万年薪招揽的DeepSeek开源大模型DeepSeek-V2的关键开发者之一,被誉为“天才AI少女”的罗福莉,曾直言:“在幻方,技术理想比商业回报更有吸引力。”
DeepSeek的崛起,侧面反映出国产芯片行业的当前困局。
03中国需要100个DeepSeek
“中国AI芯片的问题不在制程,而在生态。”
“如果我们能让国产芯片的算法效率提升30%,就能撕开一道口子。”
在近期央视访谈中,梁文锋如是谈到。
为了规避英伟达限制,DeepSeek使用华为升腾910B训练模型,但算子兼容性问题导致训练效率降低40%,团队不得不用30%工程师人力开发转换工具。对此,梁文辉认为,这原本该是芯片厂商的工作。
此外,也有业内观点认为,如果中国AI只能在英伟达芯片和OpenAI论文基础上修修补补,这不过是另一种形式的代工。
当多数公司焦虑“何时做出中国版GPT-4”时,幻方用数学思维重新定义竞争维度——不做参数规模的奴隶,而是深耕“输入1度电,产出10倍智能”;
当行业沉迷资本故事时,幻方证明,用量化交易的“快钱”支撑硬核科技的“慢研发”,并非天方夜谭;
当全球追逐通用人工智能(AGI)圣杯时,中国或许更需要1000个深度改造制造业、农业、小微企业的“专用智能”。
春节假期结束第一天,DeepSeek社区出现一条高赞留言:“我们县城程序员用你的模型接了三个订单,养活了一个五人小团队。”这或许才是中国AI最真实的生命力——不在融资新闻的头条里,而在无数普通人用技术改善生活的细节中。
当全球AI陷入千亿美金“军备竞赛”时,梁文锋与幻方提供了一种反主流叙事——用数学家的极致理性、工程师的务实创新,以及近乎偏执的成本控制,证明“聪明资本”与“技术理想主义”可以共存。
这或许正是中国AI破局的关键密码:不需要另一个OpenAI,而是需要100个DeepSeek。
冷峻又务实,或为国产AI的未来。
Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.