资讯
近日,微软正式推出两款全新成员:Phi-4-Multimodal(多模态)及Phi-4-Mini(迷你版),进一步丰富了Phi-4产品家族。 Phi-4-Multimodal是微软首款采用统一 ...
正是针对这一挑战,研究团队开发了EarthMind,这是一个专门为地球观测数据设计的视觉-语言框架。与现有方法不同,EarthMind能够同时处理多尺度(从像素级到区域级再到图像级)和多传感器(如光学RGB和合成孔径雷达SAR)的地球观测数据。就像一 ...
旧金山 - 企业AI公司Sama推出了其新的多模态AI解决方案Sama Multimodal,该解决方案旨在整合各种数据类型和人工验证,以提高AI模型的准确性。在零售板块的初步部署中,模型准确性提高了35%,产品退货率降低了10%。
微软发布Phi-4-multimodal,这是一款小型语言模型(SLM)具备处理语音、图像与文本的能力,已于Azure AI Foundry、Hugging Face及Nvidia API Catalog上线。相较于 ...
9 天
科技行者 on MSN强化微调赋能多模态大语言模型的推理能力:从清华来的新研究揭示 ...在人工智能快速发展的2025年,当我们正站在通用人工智能(AGI)发展的关键节点上,由清华大学深圳国际研究生院的孙浩源、吴佳琪、夏博等研究团队发表的一篇名为《强化微调赋能多模态大语言模型的推理能力》(Reinforcement Fine-Tuning ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果