multimodal - 搜索 News

资讯

9 小时

听到基因组、蛋白质组等词汇，大家首先想到的是什么？庞杂的数据？得出的结论解释性差？虽然 DNA 基础模型拥有强大的序列表征能力，但是难以进行多步推理，并且缺乏内在透明、生物学直观的解释。在这里，来自多伦多大学（University of ...

近日，首尔国立大学的研究团队Jaewoo Ahn、Heeseung Yun、Dayoon Ko和Gunhee Kim在arXiv上发表了一篇引人深思的研究论文，题为《Can LLMs Deceive CLIP? Benchmarking ...

12 小时

2025年6月6-8日，由中国人工智能学会主办的2025全球人工智能技术大会（GAITC 2025）将在浙江杭州召开。戴琼海院士、Adrian ...

科技行者 on MSN2 天

在人工智能视觉语言理解领域，一项重大突破悄然发生。由华中科技大学沈楚明、魏威、屈晓晔和香港中文大学郑宇共同完成的研究《SATORI-R1: Incentivizing Multimodal Reasoning with Spatial ...

MangaVQA和MangaLMM的研究不仅是技术上的突破，更代表了AI向理解更复杂叙事形式迈出的重要一步。就像一个外国读者逐渐掌握阅读日本漫画的技巧一样，这项研究帮助AI系统学习理解漫画这种独特的多模态叙事形式。

Top16814 小时

AsianFin -- SenseTime Group announced a major boardroom reshuffle on the eve of the Dragon Boat Festival, revealing that ...

科技行者 on MSN5 天

在人工智能快速发展的2025年，当我们正站在通用人工智能（AGI）发展的关键节点上，由清华大学深圳国际研究生院的孙浩源、吴佳琪、夏博等研究团队发表的一篇名为《强化微调赋能多模态大语言模型的推理能力》（Reinforcement Fine-Tuning ...

作为人工智能领域的重要突破，2025年5月23日发表的论文《Multi-SpatialMLLM: Multi-Frame Spatial Understanding with MultiModal Large Language ...

在可预见的未来，训练有素的人工智能大语言模型，将走进本地社会服务机构或居家环境里，用英语、华语，新加坡式英语，甚至方言打电话给年长者，了解他们的生活情况和身体状况。如果出现不适，人工智能助手还会通过短信通知看护者或亲人。

科技行者 on MSN5 天

在多模态人工智能领域，几何数学推理一直是衡量大型多模态模型(LMM)能力的重要指标。然而，即使是当前最先进的模型如GPT-4o、Claude-3和Qwen2.5-VL，在处理几何问题时仍然会出现幻觉，比如凭空创造不存在的几何元素或错误理解空间关系。这 ...

5 天

近日，云从科技自主研发的从容大模型在国际权威评测平台OpenCompass最新全球多模态榜单中，以80.7分的综合成绩登顶榜首。

在可预见的未来，训练有素的人工智能大语言模型，将走进本地社会服务机构或居家环境里，用英语、华语、新加坡式英语，甚至方言，打电话给年长者，了解他们的身体状况并提醒服药。万一长者出现不适，人工智能助手也能第一时间发短信通报看护者或亲人。

一些您可能无法访问的结果已被隐去。