在多模态AI的领域里,微软宣布开源Magma基础模型,展现出强大的环境理解能力。Magma能够处理多模态输入,结合网页导航及机器人操作等多重功能,极大增强了其实用性。这一模型已经被CVPR接收,标志着其技术可靠性得到了认可。
据介绍,Magma使用大规模异构视觉语言(VL)数据集预训练,包含3900多万条样本,覆盖图像、视频以及机器人动作轨迹等多种形式,并采用ConvNeXt-XXL作为视觉骨干网络和Llama-3-8B作为语言模型。
视觉-语言-行动(VLA,Vision-Language-Action)模型是可以感知视觉刺激、语言输入以及其他与环境相关数据的自主智能体,能够在物理和数字环境中生成有意义的「具身行动」(embodied actions)以完成特定任务。
近日,微软研究团队发布了一个令人振奋的突破性成果——Magma。这一多模态AI基础模型的问世,不仅为未来的智能机器人与虚拟助手铺设了新道路,也让我们看到了数字世界与物理世界深度融合的曙光。今天,就让我们一起深入了解这个能跨越不同任务和环境的智能系统, ...
La misión Chang'e-6 en 2024 logró el primer muestreo de la humanidad de la cara oculta de la Luna, recuperando con éxito ...
Chinese scientists just cracked a 2.8-billion-year-old lunar mystery:🔬 Key Finds →✔️ Basalt with rare KREEP minerals ...
Un investigador del Instituto de Geología de la Academia China de Ciencias Geológicas prepara las muestras lunares recogidas ...
Um novo estudo das amostras lunares coletadas pela missão Chang'e-6 da China verificou a hipótese de que a Lua foi totalmente ...
Beijing, 28 fev (Xinhua) -- Um novo estudo das amostras lunares coletadas pela missão Chang'e-6 da China verificou a hipótese de que a Lua foi totalmente coberta por um "oceano de magma" derretido nos ...
15 天on MSN
微软近期在其官方网站上宣布,正式推出一款创新的多模态AI Agent基础模型——Magma。这款模型与众不同之处在于,它能够跨越数字与物理世界的界限,展现出前所未有的交互能力。
在人工智能日益渗透日常生活的今天,微软于2025年2月26日正式开源了名为“Magma”的多模态AI Agent。这一创新型基础模型不仅是科技发展的重要里程 ...
IT之家2 月 26 日消息,北京时间今日凌晨,微软在官网开源了多模态 AI Agent 基础模型 ——Magma。与传统 Agent 相比,Magma 具备跨数字、物理世界的多模态能力,能自动处理图像、视频、文本等不同类型数据,此外,Magma 还能内置了心理预测功能,增强了对未来视频 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果