更正:因译文有误,内文DeepSeek创始人姓名为"梁文锋",非"梁文峰"
DeepSeek可能在 5 月前发布下一代 R2 模型--消息
该初创企业以扁平化管理架构闻名,避免了中国科技巨头的通病
监管部门起初对大规模购买芯片的行为感到担心,现已对DeepSeek认可
公司被要求保持低调,因全球对其隐私保护措施不放心
路透北京/香港/新加坡2月25日 - DeepSeek 希望将自己的优势发挥到极致。
上个月,这家中国初创公司推出了一款价格低廉的人工智能推理模型,其表现优于许多西方同类产品,引发了全球股市1万多亿美元的抛售。
据三位熟悉情况的人士透露,这家总部位于杭州的公司继1月推出R1模型后,现正在加快推出后续产品。
其中两人说,Deepseek 原计划在 5 月初发布 R2,但现在希望尽早推出,不过两位人士没有提供具体细节。
该公司表示,希望新模型能生成更好的编码,并能用英语以外的其它语言进行推理。关于加快 R2 发布的具体时间表,此前没有过报道。
DeepSeek 没有回应关于本报道的置评请求。
竞争对手仍然没有从R1的震撼中恢复,虽然 R1采用并非尖端的Nvidia芯片,但与美国科技巨头耗资数千亿美元开发的芯片相比,仍具有竞争力。
R2可能让美国政府感到担忧,因为美国已将在人工智能发展中处于领先作为优先事项。R2的发布可能会进一步刺激中国政府和企业,有数十家中国公司表示已开始将 DeepSeek 模型集成到它们的产品中。
人们对DeepSeek公司知之甚少,其创始人梁文锋通过创建量化对冲基金幻方(High-Flyer)成为亿万富翁,但他被一位前雇主形容为 "低调、内向",自 2024 年 7 月以来,他未接受过任何媒体采访。
他早期有一份工作是在上海一家智能影像处理公司负责研究部门。他当时的老板周朝恩2 月 9 日接受国家媒体采访时称,梁文锋聘请那些获奖的算法工程师,并以 "扁平化管理风格 "进行运作。
在DeepSeek和幻方,梁文锋都避开了中国科技巨头的通病,即采用自上而下的僵化管理方法,给年轻员工低薪和"996"工作制。
去年9月离开公司的26岁研究人员Benjamin Liu表示,梁文锋给了他们更多的掌控权,把他们当作专家对待。
梁文锋没有回答通过 DeepSeek 发送的问题。 他去年曾告诉中国自媒体《暗涌Waves》,他刻意避免在应用开发上花费巨资,而是专注于完善人工智能模型的品质。
据三位熟悉 DeepSeek 和幻方薪酬惯例的人士称,这两家公司都以薪酬丰厚闻名。来自竞争对手的一位熟悉梁文锋的量化基金经理说,在幻方,资深数据科学家年薪达到150万元人民币并不罕见,而竞争对手给的年薪很少超过80万。
据两位业内人士称,幻方是中国最成功的量化基金之一,即使在政府进行行业整顿后,仍然管理着数百亿元人民币的资金。
**获得国家认可**
2020 年和 2021 年,幻方斥资 12 亿元购买了两个超级计算 AI 集群。第二个集群 "Fire-Flyer II "由约 1 万块Nvidia A100 芯片组成,用于训练人工智能模型。
一位直接了解官方想法的人士说,DeepSeek 当时尚未成立,因此积累这么高的计算能力引起了中国证券监管机构的注意。
"监管部门想知道,他们为什么需要这么多芯片?"这位人士说,"他们打算如何使用这些芯片?这会对市场产生什么样的影响?"
当局决定不予干预,此举对 DeepSeek 的命运至关重要:美国在 2022 年禁止向中国出口 A100 芯片时,Fire-Flyer II 已经投入使用。
一位熟悉中国官方想法的人士说,中国政府现在为 DeepSeek 庆功,但指示它未经批准不得与媒体接触。
该人士说,当局要求梁文锋保持低调,因为他们担心媒体过多的炒作会引起不必要的关注。
中国国务院和商务部以及中国证监会没有回应置评请求。
甚至在 R1 引起全球关注之前,就有迹象表明 DeepSeek 已经获得了中国政府的青睐。今年 1 月,据国家媒体报道,梁文锋作为人工智能行业的代表,在北京受到中国总理李强的接见。
随后,对其模型成本竞争力的大加宣扬,让中国政府更加相信自己可以超越美国,中国企业和政府机构以其他公司无法企及的速度采用了DeepSeek 模型。
中国至少有 13 个市政府和 10 家国有能源公司表示,已在其系统中部署了 DeepSeek,同时科技巨头联想 0992.HK 、百度 9888.HK 和腾讯 0700.HK 也已将 DeepSeek 的模型集成到其产品中。
不过,从韩国到意大利的多国政府以隐私为由,将 DeepSeek 从本国应用商店中下架。
"如果DeepSeek成为中国国家实体普遍首选的人工智能模型,西方监管机构可能会觉得,更有理由升级对人工智能芯片或软件合作的限制,"人工智能专家、对冲基金Carthage Capital创始人Stephen Wu说。
梁文锋承认,进一步限制先进人工智能芯片是一个挑战。
"我们的问题从来都不是资金,"他在去年7月告诉《暗潮Waves》,"问题在于对高端芯片的禁运"。(完)
(编审 郑茵)
((yin.zheng@thomsonreuters.com; 010-56692086;))
Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.