multimodal - 搜索 News

资讯

近日，微软正式推出两款全新成员：Phi-4-Multimodal（多模态）及Phi-4-Mini（迷你版），进一步丰富了Phi-4产品家族。 Phi-4-Multimodal是微软首款采用统一 ...

正是针对这一挑战，研究团队开发了EarthMind，这是一个专门为地球观测数据设计的视觉-语言框架。与现有方法不同，EarthMind能够同时处理多尺度（从像素级到区域级再到图像级）和多传感器（如光学RGB和合成孔径雷达SAR）的地球观测数据。就像一 ...

3 天

旧金山 - 企业AI公司Sama推出了其新的多模态AI解决方案Sama Multimodal，该解决方案旨在整合各种数据类型和人工验证，以提高AI模型的准确性。在零售板块的初步部署中，模型准确性提高了35%，产品退货率降低了10%。

来自MSN3 个月

微软发布Phi-4-multimodal，这是一款小型语言模型（SLM）具备处理语音、图像与文本的能力，已于Azure AI Foundry、Hugging Face及Nvidia API Catalog上线。相较于 ...

科技行者 on MSN9 天

在人工智能快速发展的2025年，当我们正站在通用人工智能（AGI）发展的关键节点上，由清华大学深圳国际研究生院的孙浩源、吴佳琪、夏博等研究团队发表的一篇名为《强化微调赋能多模态大语言模型的推理能力》（Reinforcement Fine-Tuning ...

一些您可能无法访问的结果已被隐去。