如何证明自家的模型是行业一流水平?跟DeepSeek比一比。
随着DeepSeek爆火,2025年的大模型市场,DeepSeek就像手机圈的iPhone一样,成了各家模型厂商发布新品时的最新对标对象。
除了模型能力上号称超过DeepSeek之外,上述对标更直观的表现在价格上。
在今天百度文心大模型4.5 Turbo、文心大模型X1 Turbo发布时,百度创始人李彦宏就吐槽DeepSeek也不是万能的。除了能力上只能处理文本,还不能理解和生成图片、音频、视频等多媒体内容、幻觉率高外,李彦宏认为使用DeepSeek更大的问题是慢和贵,“中国市场上绝大多数的大模型API调用价格都比DeepSeek满血版要低,而且速度也更快。”
当然,其中也包括最新发布的文心4.5 Turbo和文心X1 Turbo。官方数据显示,文心4.5 Turbo每百万token的输入价格为0.8元,输出价格3.2元。
作为对比,即便在打五折后的优惠时段(00:30-8:30),DeepSeek V3每百万token的输入价格也达到1元,输出价格4元。
推理模型上,百度模型的性价比则进一步凸显:文心大模型X1 Turbo每百万token输入价格1元,输出价格4元,与DeepSeek R1优惠时段价格一致,但比DeepSeek R1标准时段(8:30-00:30)要便宜得多(R1每百万token输入8元,输出16元)。
想用性价比顶住DeepSeek竞争压力的不止百度一家。4月17日字节发布的豆包1.5·深度思考模型上,其每百万token的输入价格为4元,输出价格16元,综合成本上依然要比DeepSeek R1标准时段便宜。
这样的性价比策略更是不止局限于国内大模型玩家。国外同样如此。
4月份谷歌发布的首个混合推理模型Gemini 2.5 Flash,便主打一个低成本。在关闭思考模式下,Gemini 2.5 Flash每百万token输出成本暴降600%,可以达到0.6美元/百万token,输入价格0.15美元,也远低于DeepSeek R1标准时段价格。
稍微偏离性价比策略的模型玩家是OpenAI。
2月底发布GPT-4.5后,其API价格达到75美元/百万token输入、150美元/token输出,是GPT-4o的30倍,高昂价格令其饱受争议。
但OpenAI很快纠正了自己的“错误”。2个月后的4月份,OpenAI专为开发者推出了三款全新模型:GPT-4.1、GPT-4.1 mini和GPT-4.1 nano。最便宜的GPT4.1 nano,每百万token输入价格暴降至0.1美元,输出价格0.4美元。
但只靠性价比显然还不足以打开市场。DeepSeek之所以能够出圈,除了低成本之外,其重要前提之一是模型能力有了创新,首次向外界免费展示了思维链的奇妙存在。
01
模型降本是趋势,但国外比国内更贵
延续至今的大模型降本之争,源头便是DeepSeek。2024年5月,DeepSeek借助大模型价格战一跃成名。当时,DeepSeek发布了DeepSeek V2开源模型,并在行业内率先降价,将推理成本降到每百万token仅1块钱,约等于GPT-4 Turbo的七十分之一。
随后,字节、腾讯、百度、阿里等科技大厂纷纷降价跟进。中国大模型价格战由此揭幕。
在接受“暗涌”采访时,DeepSeek创始人梁文锋解释道,抢用户并不是DeepSeek降价的主要目的。“我们降价一方面是因为我们在探索下一代模型的结构中,成本先降下来了,另一方面也觉得无论API,还是AI,都应该是普惠的、人人可以用得起的东西。”
此前,有云厂商高管曾向直面AI(ID:faceaibang)解释:“降价一直存在,并且只要摩尔定律在,降低计算成本将一直是模型行业的趋势。”
包括李彦宏在内的部分大佬更是认为,降本将是推动AI应用爆发的重要前提。
但在降本的全球趋势之下,值得注意的不同现象是,国外同类型、同尺寸的模型,调用成本依然要比国内的更贵。
4月份刚刚发布的OpenAI o3新推理模型上,其每百万token的输入价格为10美元,输出价格40美元。但以输入价格论,o3是文心X1 Turbo的超70倍。
造成这种不同的原因之一,或许也跟国外模型厂商的多元化商业变现有关。
相比国内只能靠B端API调用收费,目前国外还有来自C端的销售订阅服务,甚至后者商业变现能力还要强于前者。The Information爆料,OpenAI今年订阅销售额有望达到80亿美元,远超销售其API接口的约20亿美元。
OpenAI CEO奥特曼近期在接受采访时就谈道,自己更感兴趣的是,弄清楚如何为一个真正出色的自动化软件工程师,或者其他类型的代理,向人们收取高额费用,而不是通过基于广告的模式来赚取一些小钱。
此前,外界就曾爆出,OpenAI有望推出高达2000美元,乃至2万美元的月度订阅制。目前,OpenAI设有每月20美元和200美元两档订阅模式。
02
只有性价比还不够,关键在于模型是否有特色
商业变现受限之下,陷入价格战之中的国内模型厂商,还可能迎来更大的成本压力,甚至跌入互联网时代烧钱补贴的竞争逻辑。
更大的挑战还在于,仅靠性价比也并不能彻底留住用户。
DeepSeek在去年开启价格战后,虽然在行业内开始崭露头角,但并未在大众层面引发关注。直到DeepSeek R1模型的到来,DeepSeek才真正出圈,成为一款家喻户晓的AI产品。
奥特曼在点评DeepSeek爆火现象时曾认为,模型的能力并不是真正让DeepSeek获得病毒式传播的关键,关键在于DeepSeek免费开放了OpenAI隐藏起来的思维链。
但环顾当下的一众新模型产品,除了在各项数据上比肩或者赶超DeepSeek,乃至OpenAI之外,它们尚未在产品体验和功能上有创新之举。
这方面从谷歌到豆包,都先后做过了反面示例。晚于DeepSeek R1近两天发布的豆包1.5 Pro大模型,尽管在预训练和推理成本上还要低于DeepSeek V3,但却因为模型体验不如前者,而未能在舆论场上激起太多水花。
同样赶在DeepSeek R1之后发布的谷歌Gemini 2.0系列大模型,尽管其Gemini 2.0 Flash-Lite版本的调用价格,比DeepSeek V3更低,但仅靠价格优势,也依然难以俘获用户的芳心。
这也从某种程度上解释了,为什么顶着全球最贵大模型称号的Claude,依然能俘获一批开发者的芳心,如继DeepSeek之后另一出圈的通用AI Agent产品Manus,便是基于Anthropic的Claude 3.5模型开发而来。
一切竞争的原点,都又回到了底层模型的技术创新和突破上。
Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.