更正:因译文有误,内文DeepSeek创始人姓名为"梁文锋",非"梁文峰"
DeepSeek可能在 5 月前发布下一代 R2 模型--消息
该初创企业以扁平化管理架构闻名,避免了中国科技巨头的通病
监管部门起初对大规模购买芯片的行为感到担心,现已对DeepSeek认可
公司被要求保持低调,因全球对其隐私保护措施不放心
路透北京/香港/新加坡2月25日 - DeepSeek 希望将自己的优势发挥到极致。
上个月,这家中国初创公司推出了一款价格低廉的人工智能推理模型,其表现优于许多西方同类产品,引发了全球股市1万多亿美元的抛售。
据三位熟悉情况的人士透露,这家总部位于杭州的公司继1月推出R1模型后,现正在加快推出后续产品。
其中两人说,Deepseek 原计划在 5 月初发布 R2,但现在希望尽早推出,不过两位人士没有提供具体细节。
该公司表示,希望新模型能生成更好的编码,并能用英语以外的其它语言进行推理。关于加快 R2 发布的具体时间表,此前没有过报道。
DeepSeek 没有回应关于本报道的置评请求。
竞争对手仍然没有从R1的震撼中恢复,虽然 R1采用并非尖端的Nvidia芯片,但与美国科技巨头耗资数千亿美元开发的芯片相比,仍具有竞争力。
R2可能让美国政府感到担忧,因为美国已将在人工智能发展中处于领先作为优先事项。R2的发布可能会进一步刺激中国政府和企业,有数十家中国公司表示已开始将 DeepSeek 模型集成到它们的产品中。
人们对DeepSeek公司知之甚少,其创始人梁文锋通过创建量化对冲基金幻方(High-Flyer)成为亿万富翁,但他被一位前雇主形容为 "低调、内向",自 2024 年 7 月以来,他未接受过任何媒体采访。
他早期有一份工作是在上海一家智能影像处理公司负责研究部门。他当时的老板周朝恩2 月 9 日接受国家媒体采访时称,梁文锋聘请那些获奖的算法工程师,并以 "扁平化管理风格 "进行运作。
在DeepSeek和幻方,梁文锋都避开了中国科技巨头的通病,即采用自上而下的僵化管理方法,给年轻员工低薪和"996"工作制。
去年9月离开公司的26岁研究人员Benjamin Liu表示,梁文锋给了他们更多的掌控权,把他们当作专家对待。
梁文锋没有回答通过 DeepSeek 发送的问题。 他去年曾告诉中国自媒体《暗涌Waves》,他刻意避免在应用开发上花费巨资,而是专注于完善人工智能模型的品质。
据三位熟悉 DeepSeek 和幻方薪酬惯例的人士称,这两家公司都以薪酬丰厚闻名。来自竞争对手的一位熟悉梁文锋的量化基金经理说,在幻方,资深数据科学家年薪达到150万元人民币并不罕见,而竞争对手给的年薪很少超过80万。
据两位业内人士称,幻方是中国最成功的量化基金之一,即使在政府进行行业整顿后,仍然管理着数百亿元人民币的资金。
**获得国家认可**
2020 年和 2021 年,幻方斥资 12 亿元购买了两个超级计算 AI 集群。第二个集群 "Fire-Flyer II "由约 1 万块Nvidia A100 芯片组成,用于训练人工智能模型。
一位直接了解官方想法的人士说,DeepSeek 当时尚未成立,因此积累这么高的计算能力引起了中国证券监管机构的注意。
"监管部门想知道,他们为什么需要这么多芯片?"这位人士说,"他们打算如何使用这些芯片?这会对市场产生什么样的影响?"
当局决定不予干预,此举对 DeepSeek 的命运至关重要:美国在 2022 年禁止向中国出口 A100 芯片时,Fire-Flyer II 已经投入使用。
一位熟悉中国官方想法的人士说,中国政府现在为 DeepSeek 庆功,但指示它未经批准不得与媒体接触。
该人士说,当局要求梁文锋保持低调,因为他们担心媒体过多的炒作会引起不必要的关注。
中国国务院和商务部以及中国证监会没有回应置评请求。
甚至在 R1 引起全球关注之前,就有迹象表明 DeepSeek 已经获得了中国政府的青睐。今年 1 月,据国家媒体报道,梁文锋作为人工智能行业的代表,在北京受到中国总理李强的接见。
随后,对其模型成本竞争力的大加宣扬,让中国政府更加相信自己可以超越美国,中国企业和政府机构以其他公司无法企及的速度采用了DeepSeek 模型。
中国至少有 13 个市政府和 10 家国有能源公司表示,已在其系统中部署了 DeepSeek,同时科技巨头联想 0992.HK 、百度 9888.HK 和腾讯 0700.HK 也已将 DeepSeek 的模型集成到其产品中。
不过,从韩国到意大利的多国政府以隐私为由,将 DeepSeek 从本国应用商店中下架。
"如果DeepSeek成为中国国家实体普遍首选的人工智能模型,西方监管机构可能会觉得,更有理由升级对人工智能芯片或软件合作的限制,"人工智能专家、对冲基金Carthage Capital创始人Stephen Wu说。
梁文锋承认,进一步限制先进人工智能芯片是一个挑战。
"我们的问题从来都不是资金,"他在去年7月告诉《暗潮Waves》,"问题在于对高端芯片的禁运"。(完)
(编审 郑茵)
((yin.zheng@thomsonreuters.com; 010-56692086;))
免责声明:投资有风险,本文并非投资建议,以上内容不应被视为任何金融产品的购买或出售要约、建议或邀请,作者或其他用户的任何相关讨论、评论或帖子也不应被视为此类内容。本文仅供一般参考,不考虑您的个人投资目标、财务状况或需求。TTM对信息的准确性和完整性不承担任何责任或保证,投资者应自行研究并在投资前寻求专业建议。