资讯

听到基因组、蛋白质组等词汇,大家首先想到的是什么?庞杂的数据?得出的结论解释性差? 虽然 DNA 基础模型拥有强大的序列表征能力,但是难以进行多步推理,并且缺乏内在透明、生物学直观的解释。 在这里,来自多伦多大学(University of ...
近日,首尔国立大学的研究团队Jaewoo Ahn、Heeseung Yun、Dayoon Ko和Gunhee Kim在arXiv上发表了一篇引人深思的研究论文,题为《Can LLMs Deceive CLIP? Benchmarking ...
2025年6月6-8日,由中国人工智能学会主办的2025全球人工智能技术大会(GAITC 2025)将在浙江杭州召开。戴琼海院士、Adrian ...
在人工智能视觉语言理解领域,一项重大突破悄然发生。由华中科技大学沈楚明、魏威、屈晓晔和香港中文大学郑宇共同完成的研究《SATORI-R1: Incentivizing Multimodal Reasoning with Spatial ...
MangaVQA和MangaLMM的研究不仅是技术上的突破,更代表了AI向理解更复杂叙事形式迈出的重要一步。就像一个外国读者逐渐掌握阅读日本漫画的技巧一样,这项研究帮助AI系统学习理解漫画这种独特的多模态叙事形式。
AsianFin -- SenseTime Group announced a major boardroom reshuffle on the eve of the Dragon Boat Festival, revealing that ...
在人工智能快速发展的2025年,当我们正站在通用人工智能(AGI)发展的关键节点上,由清华大学深圳国际研究生院的孙浩源、吴佳琪、夏博等研究团队发表的一篇名为《强化微调赋能多模态大语言模型的推理能力》(Reinforcement Fine-Tuning ...
作为人工智能领域的重要突破,2025年5月23日发表的论文《Multi-SpatialMLLM: Multi-Frame Spatial Understanding with MultiModal Large Language ...
在可预见的未来,训练有素的人工智能大语言模型,将走进本地社会服务机构或居家环境里,用英语、华语,新加坡式英语,甚至方言打电话给年长者,了解他们的生活情况和身体状况。如果出现不适,人工智能助手还会通过短信通知看护者或亲人。
在多模态人工智能领域,几何数学推理一直是衡量大型多模态模型(LMM)能力的重要指标。然而,即使是当前最先进的模型如GPT-4o、Claude-3和Qwen2.5-VL,在处理几何问题时仍然会出现幻觉,比如凭空创造不存在的几何元素或错误理解空间关系。这 ...
近日,云从科技自主研发的从容大模型在国际权威评测平台OpenCompass最新全球多模态榜单中,以80.7分的综合成绩登顶榜首。
在可预见的未来,训练有素的人工智能大语言模型,将走进本地社会服务机构或居家环境里,用英语、华语、新加坡式英语,甚至方言,打电话给年长者,了解他们的身体状况并提醒服药。万一长者出现不适,人工智能助手也能第一时间发短信通报看护者或亲人。