来源:TIME
原标题:What to Know About DeepSeek, the Chinese AI Company Causing Stock Market Chaos
作者:Billy Perrigo、Tharin Pillay
编译及整理:比推BitpushNews
近日,中国杭州初创公司 DeepSeek 创建的新型 AI 模型震惊了美国 AI 业。它的表现超越了OpenAI的领先模型,取代ChatGPT 登顶 iOS 应用商店的榜首,并替代Meta成为“开源 AI 工具”的领先供应商。
所有叙事都指向一个关键问题:尽管美国对中国获取先进半导体的能力实施了制裁,但中国在全球 AI 竞赛中是否正在赶上美国?
DeepSeek 上周发布的新 R1 模型据称训练成本仅为 600 万美元,但在多个数学和推理指标上的表现却能与OpenAI 的 o1 模型相媲美——这是 OpenAI 及其支持者微软数百亿美元投资的成果。
中国模式对用户来说也更便宜。使用其最强大版本的成本比 OpenAI 及其竞争对手低 95% 左右。结果是:美国科技行业突然面临一个可能更便宜、更强大的挑战者,这让投资者感到不安,周一开盘,美国科技股遭遇疯狂抛售。
但并非所有人都相信,一些美国人工智能研究人员对DeepSeek真实的成本、以及部署了多少先进芯片来创建模型的说法表示怀疑。
然而,很少有人质疑 DeepSeek 的惊人能力。
美国著名风险投资家马克·安德森 (Marc Andreessen)在 X 上写道:“Deepseek R1 是人工智能的斯普特尼克时刻” ,斯普特尼克指的是冷战期间苏联成功将一颗卫星送入轨道的时刻。
那么,DeepSeek 是什么?它对美国科技霸权意味着什么?
什么是 DeepSeek?
DeepSeek 成立于不到两年前,由中国对冲基金幻方资本 (High-Flyer Capital Management) 创立,是一家致力于研究通用人工智能 (AGI) 的研究实验室。2024 年底发布的一系列开源版本让这家初创公司名声大噪,其中包括大型语言模型“v3”,其表现优于 Meta 的所有开源 LLM,可与 OpenAI 的闭源 GPT4-o 相媲美。
当时,首席执行官梁文峰表示,他聘请了一批年轻的计算机科学研究团队,目的是“解决世界上最难的问题”——关键是,不以盈利为目的。早期成果令人鼓舞:他的产品非常高效,以至于 DeepSeek 2024 年的发布引发了中国人工智能行业的价格战,迫使竞争对手大幅降价。
今年,这场价格战似乎将蔓延至太平洋彼岸。
然而,DeepSeek 的人工智能与美国竞争对手有一个重要区别。 尽管 DeepSeek 的模型在推理测试中表现出色,但它们受到一些政策的限制。例如,DeepSeek R1 拒绝回答某些较为敏感的历史话题。
DeepSeek 的成功对美国科技巨头意味着什么
正当谷歌、Meta、微软、亚马逊及其数十家竞争对手准备再投入数百亿美元建设新的人工智能基础设施时,DeepSeek 的成功引发了一个令人不安的问题:中国科技公司是否有可能在投入更少的情况下匹敌甚至超越硅谷的技术实力?
据科技新闻网站 The Information 上周末报道,Meta 计划今年在人工智能基础设施上投入 650 亿美元,目前已经建立了四个“作战室”来分析 DeepSeek 的模型,试图找出这家中国公司如何以如此低的成本训练模型,并利用这些见解改进自己的开源 Llama模型。
在金融市场,由于担心训练强大的人工智能所需的人工智能芯片数量可能比之前预想的要少,英伟达股价周一上午下跌逾 15%。其他美国科技股也出现下跌。
Pictet Asset Management 首席策略师 Luca Paolini 表示:“虽然 [DeepSeek R1] 对用户和全球经济来说是个好消息,但对美国科技股来说却是个坏消息。在估值和增长预期非常高的情况下,这可能会导致人工智能资本投资名义上缩减,并给利润率带来压力。”
但美国科技还没有失败——至少现在还没有。
目前,OpenAI 的“o1 Pro”模型仍被认为是世界上最先进的。然而,DeepSeek R1 的表现确实表明,中国比以前想象的更接近人工智能的前沿,开源模型已经赶上了闭源模型。
对于 OpenAI 和谷歌等闭源模型公司来说,更令人担忧的可能是 DeepSeek 向消费者收取的费用——或者说,费用太低了——以访问其最先进的模型。OpenAI 对其最先进的模型 o1 输出的每百万个“token”(即词段)收取 60 美元。相比之下,DeepSeek 对 R1 输出的相同数量 token 收取 2.19 美元——几乎低了 30 倍。
与美国政府密切合作的人工智能公司 Gladstone AI 的首席技术官爱德华·哈里斯 (Edouard Harris) 表示:“它侵蚀了工业基础,侵蚀了利润,削弱了私人资本进一步投资西方(人工智能)扩张的动力。”
…但是 Deepseek 是透明的吗?
DeepSeek 的成功更具爆炸性,因为它似乎让人质疑美国政府通过限制向中国出口强大芯片或 GPU 来限制其人工智能战略的有效性。如果 DeepSeek 的说法属实,则意味着尽管存在这些限制,中国仍有能力创建强大的人工智能模型,这凸显了美国战略的局限性。
DeepSeek 声称,其制约因素是芯片,而不是资金或人才。该公司表示,其仅使用 2,000 块二级 Nvidia 芯片训练其 v3 和 R1 模型。DeepSeek 首席执行官梁文峰在 2024 年表示:“钱从来都不是我们的问题。禁止出口先进芯片才是问题所在。”(美国现行政策禁止向中国出口最先进的 AI 芯片,OpenAI 和微软使用的美国数据中心就装有这类芯片。)
但这些说法是真的吗?
Scale AI 首席执行官Alexandr Wang最近在达沃斯接受CNBC采访时表示:“据我了解,DeepSeek 拥有 50,000 块 H100 芯片。”H100 是目前市场上性能最高的 Nvidia GPU 芯片。“他们不能公开谈论 [这个],因为这违反了美国实施的出口管制。”(这种规模的 H100 集群将耗资数十亿美元。)
上周一,中国总理李强在北京与梁文峰见面,这表明中国对这项技术的重视程度。据报道,在那次会议上,梁文峰表示,DeepSeek 需要更多芯片。“DeepSeek 只能使用几千个 GPU,但他们却成功了,”Gladstone AI 首席执行官杰瑞米·哈里斯 (Jeremie Harris) 表示。“因此,这引出了一个显而易见的问题:如果他们从政府那里获得拨款,全速推进,会发生什么?”
尽管中国可能用更少的芯片实现了惊人的人工智能能力,但专家表示,更多的计算能力将始终是一种战略优势。在这方面,美国仍然遥遥领先。乔治梅森大学研究员迪恩·鲍尔说:“拥有更多计算能力永远不是坏事。无论你拥有多少,你都会使用它。”
这将对中美科技竞争产生怎样的影响?
简短的回答是:从华盛顿的角度来看,情况尚不确定。
在拜登政府任期即将结束的日子里,即将离任的国家安全顾问杰克·沙利文 (Jake Sullivan)警告称,人工智能发展速度是“目前世界上最具影响力的事情”。就在上任几天后,特朗普总统宣布成立一个由 OpenAI 和其他公司支持的 5000 亿美元新企业,以建设对创造“通用人工智能”至关重要的基础设施——这是人工智能的下一个飞跃,其系统将足够先进,能够取得新的科学突破,以近似科幻小说中描述的那种方式进行推理。
尽管关于美国对中国芯片限制的未来仍存在疑问,但华盛顿的优先事项在特朗普总统上任第一周签署的人工智能行政命令中显而易见,该命令宣布“美国的政策是维持和加强美国在全球人工智能领域的主导地位,以促进人类繁荣、经济竞争力和国家安全。”
专家表示,保持这种主导地位至少在一定程度上意味着要准确了解中国科技公司在做什么,以及保护美国的知识产权。
Gladstone AI 的爱德华·哈里斯 (Edouard Harris) 表示:“DeepSeek 和许多其他中国大公司很有可能得到了中国政府的支持,而不仅仅是资金方面的支持。”他还建议美国人工智能公司加强安全措施。
人工智能将走向何方?
自 12 月以来,OpenAI 的新 o1 和 o3 模型打破了人工智能模型难以通过的高级推理测试的记录。
DeepSeek R1 做了类似的事情,在这个过程中体现了许多研究人员所说的范式转变:研究人员不是扩大用于训练模型的计算能力,而是扩大模型在回答问题之前思考响应的时间(以及计算能力和电力)。研究人员称之为“测试时间计算”的这种扩展将新一类“推理模型”(如 DeepSeek R1 和 OpenAI 的 o1)与不太复杂的前辈区分开来。许多人工智能研究人员认为,在这种范式达到极限之前,还有很大的发展空间。
一些人工智能研究人员认为,DeepSeek 的 R1 取得了与 DeepMind 的 AlphaZero 同等水平的突破,AlphaZero 是 2017 年推出的模型,它通过纯粹与自己对弈而不断提高,而不是观察任何人类游戏,从而成为国际象棋和围棋棋盘游戏中的超人。
这是因为R1 并没有像其他领先的 LLM 那样对人工标记的数据进行“预训练”。
相反,DeepSeek 的研究人员找到了一种方法,让模型从头开始引导自己的推理能力。
他们表示:“我们不需要明确地教导模型如何解决问题,而只需为其提供适当的激励,它就会自主开发出先进的解决问题的策略。”
这一发现意义重大,因为它表明,只要应用更多的计算能力,强大的人工智能能力可能会以比以前想象的更快的速度出现,而且所需的人力更少。“DeepSeek R1 就像是这种扩展范式的 GPT-1,”Ball 说。
最终,中国最近在人工智能领域的进步非但不会取代美国的地位,反而可能是一个重新排序的开始——换句话说,这是一个向未来迈出的一步,未来不再是一个霸权国家,而是多个人工智能力量中心相互竞争。
OpenAI 前政策工作人员 Miles Brundage 在 X 上写道:“除非发生战争,否则中国在一年之内也会拥有自己的超级智能,比美国晚不到一年。所以,除非你想要(发生战争),由多个国家共同发展的多极化人工智能格局似乎是必然的。”
Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.