海通證券:DeepSeek理論利潤率達545% 2025年有望成為大模型及其應用爆發之年

智通財經
03-04

智通財經APP獲悉,海通證券發佈研報稱,整個2月,我國的國產大模型仍然沒有停下快速迭代的腳步,行業仍在持續且高速的發展過程中,OpenAI 4.5的發佈,也印證了海外AI業界同樣未曾停滯,仍在積極探索。而DeepSeek開源周的發佈,則是毫無保留的向AI業界展示了其先進模型背後的許多AIInfra和基礎技術方面的創新,這對行業內其他的研發者起到了寶貴的啓發作用,從而有望進一步推動整個AI業界的更快速的發展和創新,而DeepSeek高達545%的理論利潤率,更是說明AI目前商業化的基礎已成,AI大模型已經真正成爲一個“能賺錢”且“能賺大錢”的商業模式。該行判斷,2025年有望真正成爲國產大模型和國產應用的爆發之年。

海通證券主要觀點如下:

混元新一代快思考模型TurboS正式發佈

2月27日,騰訊混元新一代快思考模型TurboS正式發佈。區別於Deepseek R1等需要“想一下再回答”的慢思考模型,混元TurboS能夠實現“秒回”,更快速輸出答案,吐字速度提升一倍,首字時延降低44%。在知識、數理、創作等方面,TurboS也有不錯表現。慢思考更像理性思維,通過拆解邏輯提供解決問題的思路;快思考正如人的“直覺”,爲大模型提供了通用場景下的快速響應能力。快思考和慢思考的結合和補充,可以讓大模型更智能、更高效地解決問題。通過長短思維鏈融合,混元TurboS在保持文科類問題快思考體驗的同時,基於自研混元T1慢思考模型合成的長思維鏈數據,顯著改進了理科推理能力,實現模型整體性能明顯提升。混元TurboS在知識、數學、推理等多個領域,展現出對標DeepSeek V3、GPT 4o、Claude等一系列業界領先模型的效果表現。

Turbo S全新升級架構體系,同步推出深度思考推理模型T1

架構方面,混元TurboS創新採用Hybrid-Mamba-Transformer融合模式,有效降低了傳統Transformer結構的計算複雜度,減少了KV-Cache緩存佔用,實現訓練和推理成本的下降。新的融合模式突破了傳統純Transformer結構大模型面臨的長文訓練和推理成本高的難題。一方面,發揮了Mamba高效處理長序列的能力;另一方面,也保留Transformer擅於捕捉複雜上下文的優勢,最終構建了顯存與計算效率雙優的混合架構。這也是工業界首次成功將Mamba架構無損地應用在超大型MoE模型上。作爲旗艦模型,混元TurboS未來將成爲騰訊混元系列衍生模型的核心基座,爲推理、長文、代碼等衍生模型提供基礎能力。基於TurboS,通過引入長思維鏈、檢索增強和強化學習等技術,混元也推出了具備深度思考的推理模型T1,其能理解問題的多重維度和潛在邏輯關係,特別適合完成複雜任務。

阿里視頻生成大模型Wan2.1正式開源,大幅領先了Sora等競品

2月25日,阿里通義旗下視頻生成大模型Wan2.1正式開源,14B/1.3B雙版本上線。專業版14B擁有高性能,提供業界頂尖的表現力,滿足對視頻質量有極高要求的場景;極速版1.3B適合消費級顯卡,8.2GB顯存即可生成480P高質量視頻,適用於二次模型開發和學術研究。本次開源的Wan2.1在處理複雜運動、還原真實物理規律、提升影視質感以及優化指令遵循方面具有顯著的優勢,無論是創作者、開發者還是企業用戶,都可以根據自己的需求選擇合適的模型和功能,輕鬆實現高質量的視頻生成。同時,萬相還支持業內領先的中英文文字特效生成,滿足廣告、短視頻等領域的創意需求。在權威評測集VBench中,萬相以總分86.22%的成績登上榜首位置,大幅領先了Sora、Minimax、Luma、Gen3、Pika等國內外視頻生成模型。

GPT-4.5發佈,擁有更高的“情商”

OpenAI正式發佈GPT-4.5,這是OpenAI迄今爲止最大且最優的聊天模型。GPT-4.5在擴大預訓練和後訓練規模方面邁出了重要一步。通過擴展無監督學習,GPT-4.5提升了其識別模式、建立聯繫以及在不依賴推理的情況下生成創造性見解的能力。早期測試表明,與GPT-4.5的互動感覺更加自然。其更廣泛的知識基礎、改進的理解用戶意圖的能力以及更高的“情商”使其在提升寫作、編程和解決實際問題等任務中表現出色。OpenAI還預計它的“幻覺”現象會減少。GPT-4.5在回應前不會進行思考,這使得它的優勢與推理模型(如OpenAI o1)截然不同。與OpenAI o1和OpenAI o3-mini相比,GPT-4.5是一個更通用、內在更智能的模型。OpenAI相信推理能力將是未來模型的核心能力,並且兩種擴展方式——預訓練和推理——將相輔相成。隨着GPT-4.5這樣的模型通過預訓練變得更加智能和知識淵博,它們將爲推理和工具類Agents提供更堅實的基礎。

DeepSeek開源周第一日

開源專爲英偉達HopperGPU優化的高效MLA解碼內核。根據界面新聞官方微博,2月24日,DeepSeek “開源周”正式啓動,計劃開源多個代碼庫,旨在以完全透明的方式與全球開發者社區分享其在通用人工智能(AGI)領域的研究進展。回顧這五日,其最先開源的是FlashMLA,這是專爲英偉達HopperGPU優化的高效MLA解碼內核,專爲處理可變長度序列設計。在自然語言處理等任務裏,數據序列長度不一,傳統處理方式會造成算力浪費。而FlashMLA如同智能交通調度員,能依據序列長度動態調配計算資源。例如在同時處理長文本和短文本時,它可以精準地爲不同長度的文本分配恰當的算力,避免“大馬拉小車”或資源不足的情況。發佈6小時內,GitHub上收藏量突破5000次,被認爲對國產GPU性能提升意義重大。

DeepSeek開源周第二日

開源用於MoE訓練和推理的開源EP通信庫。第二日開源的是DeepEP。DeepEP是首個用於MoE(混合專家模型)訓練和推理的開源EP通信庫。MoE模型訓練和推理中,不同專家模型需高效協作,這對通信效率要求極高。DeepEP支持優化的全對全通信模式,就像構建了一條順暢的高速公路,讓數據在各個節點間高效傳輸。它還原生支持FP8低精度運算調度,降低計算資源消耗,並且在節點內和節點間都支持NVLink和RDMA,擁有用於訓練和推理預填充的高吞吐量內核以及用於推理解碼的低延遲內核。簡單來說,它讓MoE模型各部分間溝通更快、消耗更少,提升了整體運行效率。

DeepSeek開源周第三日

開源矩陣乘法加速庫DeepGEMM。第三日開源的是DeepGEMM,矩陣乘法加速庫,爲V3/R1的訓練和推理提供支持。通用矩陣乘法是衆多高性能計算任務的核心,其性能優化是大模型降本增效的關鍵。DeepGEMM採用了DeepSeek-V3中提出的細粒度scaling技術,僅用300行代碼就實現了簡潔高效的FP8通用矩陣乘法。它支持普通GEMM以及專家混合(MoE)分組GEMM,在HopperGPU上最高可達到1350+FP8 TFLOPS(每秒萬億次浮點運算)的計算性能,在各種矩陣形狀上的性能與專家調優的庫相當,甚至在某些情況下更優,且安裝時無需編譯,通過輕量級JIT模塊在運行時編譯所有內核。

DeepSeek開源周第四日

開源了開源優化並行策略(DualPipe和EPLB)。DualPipe是一種用於V3/R1訓練中計算與通信重疊的雙向管道並行算法。以往的管道並行存在“氣泡”問題,即計算和通信階段存在等待時間,造成資源浪費。DualPipe通過實現“向前”與“向後”計算通信階段的雙向重疊,將硬件資源利用率提升超30%。EPLB則是一種針對V3/R1的專家並行負載均衡器。基於混合專家(MoE)架構,它通過冗餘專家策略複製高負載專家,並結合啓發式分配算法優化GPU間的負載分佈,減少GPU閒置現象。

DeepSeek開源周第五日

開源並行文件系統3FS,提升AI模型訓練和推理的效率。在第五日,DeepSeep開源了面向全數據訪問的推進器3FS,也就是Fire-Flyer文件系統。它是一個專門爲了充分利用現代SSD和RDMA網絡帶寬而設計的並行文件系統,能實現高速數據訪問,提升AI模型訓練和推理的效率。此外,DeepSeek還開源了基於3FS的數據處理框架Smallpond,它可以進一步優化3FS的數據管理能力,讓數據處理更加方便、快捷。全球開發者可基於上述開源項目進行二次開發與改進,有望推動AI技術在更多領域的應用。

DeepSeek開源周第六日

介紹DeepSeek-V3/R1的推理系統,(理論)成本利潤率高達545%。根據機器之心官方微信公衆號,3月1日,DeepSeek官方X帳號再次更新,宣告“開源周”還在繼續。不過這第六天DeepSeek並沒有開源新的軟件庫,而是介紹了DeepSeek-V3/R1的推理系統。DeepSeek-V3/R1的推理系統採用了跨節點EP驅動的批量擴展、計算-通信重疊、負載平衡來實現對吞吐量和延遲的優化。同時,DeepSeek還給出了其在線服務的統計數據:每個H800節點實現了73.7k/14.8k個每秒輸入/輸出token;(理論)成本利潤率高達545%。在統計了包括來自網頁、APP和API的所有用戶請求後。如果所有token都按照DeepSeek-R1的定價(0.14美元/百萬輸入token(緩存命中),0.55美元/百萬輸入token(緩存未命中),2.19美元/百萬輸出token)計費,每日總收入將爲562027美元,成本利潤率爲545%。不過,DeepSeek表示實際收入大幅低於此數字,原因如下:DeepSeek-V3的定價顯著低於R1,只有部分服務實現貨幣化(網頁和APP訪問仍然免費),在非高峯時段自動應用夜間折扣。

風險提示:技術發展不及預期,公司業務拓展不及預期。

免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。

熱議股票

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10