让硅谷难安,DeepSeek的含金量还在上升

凤凰网科技
26 Jan

摘要:

在刚刚成立的一年多时间里,DeepSeek一直不声不响,V2模型的发布成为其破圈的关键。由于模型结构层面的突破性创新,使得其将模型成本大大降低,也被业内戏称为AI届拼多多。这之后,DeepSeek也真正引发了硅谷的恐慌,OpenAI正迎来一个最强劲的对手。

凤凰网科技 出品

作者|Danny 董雨晴

OpenAI的最强对手出现了,这一次来自中国。

2025年一开年就火遍全球的DeepSeek(深度求索),1月20日晚上演了一场“偷袭珍珠港”——发布推理模型 DeepSeek-R1 正式版,同步开源模型权重,并允许用户利用模型输出、通过模型蒸馏等方式训练其他模型。这款大模型在数学、代码、自然语言推理等任务上,性能比肩OpenAI o1正式版。

R1版本的推出,在海外被惊呼“这才是真正的开放的人工智能”。英伟达高级研究科学家Jim Fan在评价R1模型时就这样说道:“我们生活在这样一个时代:一个不是美国公司的AI企业却实现了 OpenAI成立时的使命——做真正开放的前沿研究、为所有人赋能。”

凤凰网科技在此前的文章《英伟达的最大空头出现了》中曾详细介绍过深度求索(DeepSeek)和其系列大模型的核心竞争力来源,如今看来,DeepSeek的创新含金量还在上升。

随着DeepSeek的创新实力成为全球热议议题,外界也愈发关注,这家中国本土科技公司及其背后的掌舵人,究竟有何特别之处?

1 一个浙大学霸,勇闯无人区

1985年,梁文锋出生于广东湛江的一个五线城市。其具体的童年成长轨迹已不可考,从公开信息唯一可知的是,梁文锋有在采访中提到过自己的父亲是一名小学老师。

2002年,17岁的梁文锋凭借优异成绩考入浙江大学电子信息工程专业。2007年,22岁的梁文锋又考上了浙江大学信息与通信工程专业硕士。师从项志宇,主要做机器视觉研究。

2008年,23岁的梁文锋在浙江大学攻读硕士学位期间,与同学组建团队,开始收集市场行情、金融市场相关数据以及宏观经济数据。这一年,他带领团队运用机器学习技术探索全自动量化交易,而当时正值全球金融危机的爆发。

有消息称,大疆创始人汪滔曾邀请梁文锋共同创业,彼时大疆正处于起步阶段。如果梁文锋加入,或许也能在大疆的发展中实现财富自由。但梁文锋坚信人工智能将改变世界,最终决定独立创业。

2010年6月,25岁的梁文锋从浙江大学信息与通信工程专业硕士毕业,其毕业论文题目为《基于低成本PTZ摄像机的目标跟踪算法研究》。

硕士毕业后的第三年,28岁的梁文锋将人工智能与量化交易结合,和浙江大学的徐进校友创立了雅克比投资(杭州雅克比投资管理有限公司)。2015年,他们共同创立杭州幻方科技有限公司,也就是今天的浙江九章资产管理有限公司,次年又成立了宁波幻方量化投资管理合伙企业(有限合伙)。

所谓量化投资,通俗地说就是用计算机取代人,通过数量化方式,程序化发出买卖指令,投资收益较为稳定。

经过几年时间,幻方量化就在国内迅速崛起。2016年10月,幻方量化推出第一个AI模型,第一份由深度学习生成的交易仓位上线执行。到2017年底,几乎所有的量化策略都采用AI模型计算。2019年,幻方量化管理规模突破百亿,成为国内量化私募“四巨头”之一。

此后的幻方量化甚至一度成为中国首家突破千亿的私募量化大厂,准确地说也是迄今为止业内唯一规模曾迈过千亿大关的量化私募。这期间梁文锋在量化投资领域积累了强大的技术实力和算力资源,幻方量化以强大的算力支持闻名。

2023年,全球人工智能热潮爆发,梁文锋也来到了他创业之路的第十个年头。

当年5月,38岁的梁文锋宣布要做通用人工智能(AGI)。7月,杭州深度求索人工智能基础技术研究有限公司(DeepSeek)成立,专注于AI大模型的研究与开发。梁文锋也成为量化投资者投身AI创业的“第一人”。

之后便是爽文剧本式的“AI界拼多多”崛起之路,就连大厂也只能是跟随,“在豆包和阿里云之前,DeepSeek最先在全网降低了模型成本”,一位AI算法工程师对凤凰网科技表示,这让他印象非常深刻。

2024年5月,DeepSeek发布的DeepSeek V2的开源模型率先拉起了行业内的价格战。DeepSeek V2提供了一种史无前例的性价比:推理成本被降到每百万token仅1块钱,约等于Llama3 70B的七分之一,GPT-4 Turbo的七十分之一。

同年12月26日,仅仅时隔7个月,DeepSeek就又发布了DeepSeek V3,再次颠覆了行业对于价格的认知。DeepSeek V3的API定价为输入每百万tokens 0.5元(缓存命中)/2元(缓存未命中),输出每百万tokens 8元,与字节Doubao-pro-256k定价输入每百万tokens 5元,输出每百万tokens 9元的水平相当,在国产模型中性价比继续提升。

如今,当行业还沉浸在DeepSeek V3的震撼中时,DeepSeek-R1正式版又来了。这一次,DeepSeek真正引发了硅谷的恐慌。

微软CEO萨蒂亚・纳德拉在瑞士达沃斯世界经济论坛上表示:“看到DeepSeek的新模型,真的令人印象非常深刻。他们切实有效地开发出了一款开源模型,在推理计算方面表现出色,且超级计算效率极高。”

“我们必须非常、非常认真地对待中国的这些进展,”纳德拉说。

2 DeepSeek的宝贵之处,仍是创新

“DeepSeek的确有过人之处,业内都觉得他们可能是用了一些o1的数据做蒸馏,但在算法层面做了更好的创新”,一位行业从业人士认为。

在刚刚成立的一年多时间里,DeepSeek一直不声不响,据凤凰网科技了解,这家公司甚至没有设立公关团队。以至于,当多数大模型公司都在争声量,抢时间的时候,DeepSeek在闷声尝试创新。

DeepSeek的创新也是自下而上,几乎存在于整个公司内部。比如,时至今日,梁文锋的日常依旧是看论文、写代码、参与小组讨论。是少有的能堪比一线研究员能力的公司掌舵者。

由于一开始的目标就是AGI,所以DeepSeek从来不做跟随策略,即像其他商业类公司一样,选择追随全球最先进的模型,用短平快的方式做好应用,而是在模型结构层面做从0-1的创新。

在接受《暗涌》采访时,梁文锋也曾明确地表达,“因为我们觉得现在最重要的是参与到全球创新的浪潮里去。过去很多年,中国公司习惯了别人做技术创新,我们拿过来做应用变现,但这并非是一种理所当然。这一波浪潮里,我们的出发点,就不是趁机赚一笔,而是走到技术的前沿,去推动整个生态发展”。

过去,碍于人才构成和资本实力,中国企业做的往往是有限的创新,但现如今,强如字节等企业,已经有数百亿美元规模的年度利润。据凤凰网科技此前获悉,字节豆包大模型团队已在内部组建AGI长期研究团队,代号“Seed Edge”。

这意味着,创新已不再是难题,难的是如何保持人才密度,以及拥有自信。

据多位与DeepSeek有过接触的行业人士表述,DeepSeek的优势之处就在于人才密度极高,且多来自于中国本土市场。

“DeepSeek从一开始团队就是百人左右规模,但个个都很抗打”,一位AI行业猎头对凤凰网科技表示,“其实早期Kimi也曾想走这个路线,只是没有特别成功。”

另一位与DeepSeek有过接触的行业人士称,“DeepSeek给出的薪酬待遇非常具有竞争力,这让其一直对人才有很强的吸引力”。

此前据多家媒体报道,雷军曾亲自出手“挖deepseek的人”,支付的薪酬则在千万元级别。这个人正是DeepSeek-V2的关键开发者之一罗福莉,一个95后。

据量子位整理资料发现,DeepSeek团队最大的特点就是年轻。应届生、在读生,特别是来自清北的应届生在其中非常活跃。

“只招1%的天才,去做99%中国公司做不到的事情。”面试过DeepSeek的应届生这样评价其招聘风格。

这也使得DeepSeek全员上下,都保持着极致的创新动力

梁文峰在接受《暗涌》采访时同样表达过一个观点:DeepSeek在招人时主要看能力,而不是看经验。“我们的核心技术岗位,基本以应届和毕业一两年的人为主”。并且梁文锋还表达,“V2模型没有海外回来的人,都是本土的。前50名顶尖人才可能不在中国,但也许我们能自己打造这样的人。”

和上一代功成名就的故事不同,DeepSeek代表的是一个硬核创新时代的到来。上一代的成功人士是属于互联网的,他们在技术层面的突破并不多,更多是拼速度、拼资本、拼规模。

一个可喜的信号是,DeepSeek不是孤例,同样来自杭州本土市场,宇树科技最新推出的机器人B2-W同样惊艳全球,宇树科技的创始人兼CEO王兴兴,本科就读于浙江理工大学机械与自动控制学院机电专业,本科毕业后进入上海大学攻读机械工程专业研究生。

我们也有理由相信,中国科技创新的故事已经翻入了新一页。

参考资料

1. 揭秘DeepSeek:一个更极致的中国技术理想主义故事,暗涌Waves,作者:于丽丽

2. 全网都在扒的DeepSeek团队,是清北应届生撑起一片天,量子位

3. DeepSeek创始人梁文锋,广东人,仅靠百名中国程序员,赶超OpenAI,CEO来信

Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.

Most Discussed

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10