DeepSeek首次曬出賬單!日賺346萬元,理論利潤率達545%

格隆匯
03-02

週末,DeepSeek又放大招,首次披露大模型的盈利情況,引爆投資圈。

理論利潤率達545%


3月1日,DeepSeek發文披露了大規模V3、R1部署的成本和收益,成爲了第一個詳細披露了自己成本結構的大模型公司。

據DeepSeek計算,運營一天V3和R1的算力成本爲87072美元,而以R1定價來看,收入理論上爲562027美元,利潤率爲545%。

據介紹,DeepSeek V3和R1的所有服務均使用H800 GPU,使用和訓練一致的精度。

由於白天的服務負荷高,晚上的服務負荷低,因此DeepSeek實現了一套機制。在白天負荷高的時候,用所有節點部署推理服務。晚上負荷低的時候,減少推理節點,以用來做研究和訓練。

在2025年02月27日12:00至2025年02月28日12:00,DeepSeek V3和R1推理服務佔用節點總和,峯值佔用爲278個節點,平均佔用226.75個節點(每個節點爲8個H800 GPU)。假定 GPU 租賃成本爲2美金/小時,總成本爲87,072美元/天。

在24小時統計時段內,DeepSeek V3和 R1的網頁、APP和API的所有負載如下

輸入token總數爲608B,其中 342B tokens(56.3%)命中KVCache硬盤緩存。
輸出 token總數爲168B。平均輸出速率爲20~22tps,平均每輸出一個token的KVCache長度是4989。
平均每臺H800的吞吐量爲:對於prefill任務,輸入吞吐約73.7k tokens/s(含緩存命中);對於decode任務,輸出吞吐約14.8k tokens/s。

如果所有tokens全部按照DeepSeek R1的定價計算,理論上一天的總收入爲562,027美元(摺合人民幣409.36萬元),成本利潤率545%。

以此計算,DeepSeek理論上最高每天可盈利47. 5萬美元(摺合人民幣約346萬元)。

不過,DeepSeek也表示,實際上沒有這麼多收入,因爲V3的定價更低,同時收費服務只佔了一部分,另外夜間還會有折扣。

巨大的盈利下,有投資人開始按計算器,稱其在美國應該是一家估值超百億美元的公司。

MenloVentures投資人Deedy表示:“理論ARR(年收入)2億美元、利潤率超過500%,這樣的商業效率理應是一家值100億美元的公司。

還有網友評論,DeepSeek掀起了行業新一輪卷Infra熱潮。

DeepSeek官方直接披露內部的成本利潤細節,這下所有做Infra的兄弟都要被老闆上壓力了——如果利潤率達不到DeepSeek的水平,就說明自家的Infra團隊菜。

開源周收官


上週,DeepSeek進行了開源周,連續放了5天Infra相關的庫。

第一天,開源項目 FlashMLA 正式發佈,專爲Hopper GPU優化的高效MLA解碼內核,支持變長序列處理

第二天,DeepEP發佈,DeepEP是一個專爲混合專家系統(MoE)和專家並行(EP)設計的通信庫。

第三天,DeepGEMM發佈,DeepGEMM 是一個專爲簡潔高效的FP8通用矩陣乘法(GEMM)設計的庫,具有細粒度縮放功能。

第四天,DualPipe與EPLB發佈,DualPipe是一種創新的雙向管道並行算法。EPLB即專家並行負載均衡器,自動平衡GPU負載,避免部分顯卡過載或閒置。

最後一天,3FS文件系統發佈,並行文件系統Fire-Flyer File System,利用SSD和RDMA網絡技術,顯著加速數據處理。

週六,DeepSeek又披露了盈利情況,算是爲開源周做了一個很好的收尾。

免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。

熱議股票

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10