3月1日,DeepSeek接连传出两则重磅消息:
1、DeepSeek首次披露:其V3/R1推理系统的理论成本利润率高达545%,展现出显著的技术与成本优势。
2、潞晨科技宣布暂停DeepSeek API服务:用户需尽快使用账户余额,未使用部分将全额退款。
消息揭示了DeepSeek在技术创新与商业模式之间的双重挑战。
DeepSeek首次披露理论利润率
3月1日,DeepSeek在知乎平台开设了官方账号,并发布一篇技术文章——《DeepSeek-V3/R1推理系统概览》。文章显示,DeepSeek-V3/R1推理系统的优化目标是实现更大的吞吐量和更低的延迟。为了达成这两个目标,DeepSeek采用了大规模跨节点专家并行(EP)方案。这种方案虽然增加了系统的复杂性,但能有效提升性能。
DeepSeek在文章中详细介绍了如何通过EP技术增长批量大小、隐藏传输耗时以及进行负载均衡,从而优化整个推理系统的性能。通过这些技术手段,DeepSeek能够处理更大规模的数据,同时保持或提高响应速度。以下是预填充阶段的计算-通信重叠示意图:
解码阶段也采用了类似的策略,但更加精细,将Attention层进一步细分为两步,使用了五阶段流水线 (5-stage pipeline),实现更流畅的通信-计算重叠。
在成本控制方面,DeepSeek的表现尤为突出。根据官方披露的数据,V3/R1的训练成本仅为557.6万美元,不到OpenAI GPT-4o模型的1/20。其推理成本也极具竞争力,每百万token的定价仅为16元,相比OpenAI低了近70%。基于这些优化,DeepSeek的理论利润率高达545%,显示出其在成本控制和效率提升方面的巨大潜力。
潞晨科技暂停DeepSeek API服务
尽管DeepSeek在技术上取得了显著突破,但其基于MaaS的商业模式却面临严峻挑战。3月1日,潞晨科技官微宣布:“尊敬的用户,潞晨云将在一周后停止提供DeepSeek API服务,请尽快用完您的余额。如果没用完,我们全额退款。”
当天下午,潞晨科技CEO尤洋发文回应DeepSeek公布的理论成本利润率。争议焦点主要集中在以下几点:
数据参考性问题:尤洋认为文章中合并计算了DeepSeek网页、APP和MaaS API的token数,无法准确反映MaaS的真实成本和使用情况。MaaS是ToB工具,与ToC的网页和APP在性能要求和成本结构上存在显著差异。
MaaS性能与稳定性:春节期间DeepSeek APP和网页频繁掉线,延迟高达15分钟以上,无法满足ToB客户对低延迟和高稳定性的要求。MaaS作为ToB服务,需保证首字响应≤2秒、单token处理≤100ms,现有技术难以达标。
商业模式可持续性:MaaS需时刻保持超负荷运转,且需准备5倍于实际需求的机器资源以应对突发流量,导致成本高企。高投入与低毛利的矛盾使得MaaS模式难以盈利。
技术创新的实际贡献:DeepSeek在AI基础设施上依赖英伟达GPU和已有技术(如MOE架构、PD分离),并未提出颠覆性算法。中小云厂商吹嘘推理速度提升10倍,但缺乏实际盈利案例,技术优势未能转化为商业成功。
本文来源微信公众号“Wind万得”,智通财经编辑:陈秋达。
Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.