當地時間2月25日,微軟在官網開源多模態AI Agent基礎模型Magma。據介紹,與傳統Agent相比,Magma具備跨數字、物理世界的多模態能力,能自動處理圖像、視頻、文本等不同類型數據,此外,Magma還能內置了心理預測功能,增強了對未來視頻幀中時空動態的理解能力,能夠準確推測視頻中人物或物體的意圖和未來行為。
微軟開源多模態AI Agent基礎模型Magma
界面快報 · 來源:界面新聞
微軟
4.7k
- 微軟CTO預判:未來一年AI智能體記憶能力將有重大突破
- 英偉達與微軟就神經著色支持達成合作
評論
暫無評論哦,快來評價一下吧!