今天凌晨3點,微軟在官網開源了多模態AI Agent基礎模型——Magma。
與傳統Agent相比,Magma具備跨數字、物理世界的多模態能力,能自動處理圖像、視頻、文本等不同類型數據,例如,你可以用Magma來自動下電商訂單、查詢天氣;也可以自動操作實體機器人,或者下真實象棋時獲得幫助。
此外,Magma還能內置了心理預測功能,增強了對未來視頻幀中時空動態的理解能力,能夠準確推測視頻中人物或物體的意圖和未來行爲。
開源地址:https://huggingface.co/microsoft/Magma-8B
github:https://github.com/microsoft/Magma
Magma功能展示
可以用Magma來充當實體機器人的大腦,例如,把蘑菇正確地放在盆裏。
免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。