【导读】Meta员工在TeamBlind爆料,点燃了一把火。自诩开源先锋的Meta,直接被DeepSeek这家中国公司整得无地自容。不仅工程师争分夺秒复现模型,年薪超过DeepSeek训练成本的高管们,心底也有点虚。
今天,Meta员工在匿名社区TeamBlind上的一个帖子,在业内被传疯了。
DeepSeek,真实地给了美国人亿点点“震撼”。
DeepSeek R1是世界上首个与OpenAI o1比肩的AI模型,而且与o1不同, R1还是开源模型“Open Source Model”,比OpenAI还Open!
更有人曝料,DeepSeek还只是个“副项目”,主业根本不是搞大模型!
这不,OpenAI还没慌呢,Meta先慌了!
毕竟Meta一直自诩开源先锋,但DeepSeek这种程度的开源,直接把它们拍在沙滩上。
更可怕的是,DeepSeek的成本也太太太低了,这么比起来,Meta拿着超高预算的团队,就显得很尴尬。
那些一个人拿的薪资,就超过整个DeepSeek V3训练成本(仅550万美元)的高管,尤其如坐针毡。
根据内部Meta内部人士爆料,DeepSeek去年的V3,已经给他们压力了。
现在,Meta的工程师正在抓紧一切时间,争分夺秒地分析DeepSeek,试图复制其中一切可能的技术。
以前,是全世界追着美国的大模型拿着放大镜研究,现在情况竟倒转了过来,美国人也开始逆向工程了。今夕是何夕?
中国大模型的狂飙猛进,真的让我们感到了魔幻现实主义的味道。
Meta工程师吓疯了
TeamBlind上的帖子,全文曝料如下:
一切源于DeepSeek V3的出现,它在基准测试中已经让Llama 4相形见绌。更让人难堪的是,一家“仅用550万美元训练预算的中国公司”就做到了这一点。
工程师们正在争分夺秒地分析DeepSeek,试图复制其中的一切可能技术。这绝非夸张。
管理层正为如何证明GenAI研发部门的巨额投入而发愁。当部门里一个高管的薪资就超过训练整个DeepSeek V3的成本,而且这样的高管还有数十位,他们该如何向高层交代?
DeepSeek R1的出现让情况更加严峻。具体细节属于机密,不便透露,不过很快就会公开了。
这本该是一个以工程为导向的精简部门,但因为太多人想要分一杯羹,人为膨胀招聘规模,最终导致人人都付出了代价。
在成本上,“一个高管 = DeepSeek V3”,这对给高管们开出天价年薪的硅谷大厂们,实在是啪啪打脸。
更是有网友被震惊到:“DeepSeek R1在OpenAI、Meta、Grok以及谷歌的屁股下点了一把火,就像Open AI在第一次推出ChatGPT时那样震撼。如果去掉人力瓶颈,达到o1级性能真的不需要花太多钱!!”
有网友认为,在这次AI浪潮中,Meta的确落后了。
但也有网友为Meta解释,毕竟Meta已经开始行动了,虽然在GenAI领域的确“人浮于事”。
甚至,这个来自中国的AI已经上了美国的新闻。措辞非常夸张——
“中国初创企业DeepSeek,威胁了美国AI的主导地位。”
“否认、愤怒、绝望、接受,美国人正在进行艰难的心理重建。这是他们历史上从未见过的最强对手。”
不到600万美元的成本,就能训出一个如此强的模型,这简直是彻底扯掉了美国金融业的遮羞布。
AI产业,真的需要动辄数万亿美元的投资么?
连带着,特朗普和奥特曼搞的5000亿美元星际之门,也一下子变得可疑了起来。
DeepSeek-R1有多强?
“花小钱办大事”,可见DeepSeek团队的确有“独门秘籍”,在技术上恐怕也超越了OpenAI。
DeepSeek还发表了相关论文,介绍了DeepSeek-R1的大规模强化学习(RL)训练、未经过监督微调(SFT)作为预处理步骤等技术细节。
论文链接:https://arxiV.org/pdf/2501.12948
这种“技术自信”,让部分美国网友都开始了“反思”。
为何AI圈,如此惧怕DeepSeek?
来自VB最新一篇独家文章,特意将AI界黑马DeepSeek引发AI界轰动做了全面分析。
就在几天前,只有最专业的极客们才听说过DeepSeek。
它是一家成立于2015年幻方量化公司,背后投资者High-Flyer Capital Management。
直到过去几天,这家公司迅速成为硅谷最受关注的颠覆者,这主要归功于DeepSeek R1的诞生。
不用SFT,仅凭强化学习就让模型推理性能堪比o1,而且在多项基准测试中,R1甚至超越了o1。
令人瞠目结舌的是,如此强大得模型,训练成本仅500万美金,使用的GPU数量也远远低于OpenAI。
不仅如此,他们直接将其开源,Hugging Face下载量和活跃度直接爆表。
而且,开发者可以自由微调训练,API成本要比同等o1模型低90%还要多。
与OpenAI仅低性能模型上提供网页搜索不同,DeepSeek直接将R1与搜索功能深度整合。
在一步一步策略中,这家中国公司完胜了OpenAI。
第一个,但不是最后一个
这也不会是最后一个,挑战硅谷巨头主导地位的中国AI模型。
最近,字节全新发布了“豆包1.5 Pro”,在第三方基准测试中,其性能与GPT-4o模型相当,但成本仅为后者的1/50。
中国模型的快速迭代,已经引起国际关注:
《经济学人》杂志刚刚发表了一篇关于DeepSeek成功以及其他中国企业的成功。
政治评论员Matt Bruenig的实际体验,也更加印证了中国AI模型的实力。
最后一句话总结:中国AI崛起了,美国还得适应。
Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.