中國財富網訊近日,第四範式(北京)技術有限公司正式推出大模型推理端側解決方案ModelHub AIoT,爲用戶在端側部署AI模型提供了高效、便捷的全新選擇。該方案支持用戶在端側輕鬆部署諸如DeepSeek R1、Qwen 2.5、Llama 2/3系列等小尺寸蒸餾模型,並可靈活切換多個模型,兼顧了模型壓縮與推理性能,有效解決了部署與優化的複雜性問題。
第四範式總裁裴沵思表示:“ModelHub AIoT不僅能夠滿足用戶對隱私和實時性的需求,還降低了AI大模型推理成本,讓AI技術的應用更加廣泛和高效。”他介紹稱,目前ModelHub AIoT具有三方面優勢:
一是無需聯網,端側低延時運行。ModelHub AIoT依託優秀的端側推理框架,在端側算力的支持下展現出卓越的性能與適配性。模型在本地即時處理請求,能夠爲用戶提供流暢的交互體驗。即使在網絡不穩定或離線環境下,端側模型依然能夠正常運行,確保服務的連續性,爲用戶帶來穩定可靠的使用感受。
二是數據隱私與安全性提升。端側部署模型是ModelHub AIoT的一大亮點。數據無需上傳至雲端,所有計算和處理都在本地設備上完成,從而避免了數據在雲端傳輸和存儲過程中可能面臨的潛在泄露風險,顯著降低了數據被黑客攻擊或濫用的可能性,爲用戶的數據隱私和安全提供了有力保障。
三是成本效率與資源優化。端側部署有效降低了對雲端資源的依賴。通過本地處理,減少了雲端計算和存儲的需求,進而降低了服務器成本和API調用成本。同時,無需頻繁上傳大量數據,節省了網絡帶寬資源,實現了成本與資源的優化配置,爲企業和用戶帶來了更高的性價比。(張宇航)
(文章來源:中國財富網)
免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。