流量高峯“不加價”,第四範式(06682)SageOne IA一體機全新升級,支持模型彈性伸縮

智通財經
04-07

智通財經APP獲悉,近期,第四範式(06682)一體機解決方案SageOne IA全新升級,推出“模型彈性伸縮”技術來應對流量波動。當前企業一般採用傳統擴縮容方案,即當應用負載增加時,通過人工干預或系統按既定規則擴展計算節點,保證服務可用;當負載減少時釋放多餘的計算節點,這一定程度上增加了算力成本和IT運維複雜度。“模型彈性伸縮”是系統根據負載狀況,自動靈活切換同一系列下不同參數大小的模型提供模型服務,無需額外擴展計算節點,節省算力成本,提升資源使用效率的同時還大大降低運維工作量。

例如在大模型推理場景下,負載較小時,滿血版模型提供高精度的推理服務;進入高峯時段時,系統會自動將滿血版降級爲一個或多個蒸餾版/量化版模型實例,來處理大量併發請求。結合模型預加載等技術,可避免模型服務切換時,導致服務中斷或輸出質量波動問題,做到用戶無感知的平滑切換;當流量回歸常態後,系統再自動升級到滿血版模型服務,並釋放多餘的較小參數模型實例。

同時,系統可預設多種基於負載的觸發條件,如結合GPU使用率、請求隊列長度、響應延遲等資源健康度指標,形成動態切換策略和任務路由機制,使彈性方案在實際應用中更貼近業務需求。

免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。

熱議股票

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10