资讯

从实际应用角度看,KVzip为个性化AI助手、企业信息检索系统和其他需要处理长上下文的应用开辟了新可能。它显著降低了内存需求和计算成本,同时提高了推理速度,使这些技术更易于部署在资源受限的环境中。
然而,在视频理解这一领域,我们尚未看到类似的突破。 这项研究由Moonshot AI的吴昊宁(项目负责人)、刘苑欣(北京大学)等人领导,于2025年5月29日发布在arXiv预印本平台上,论文编号为2505.23359v1。研究团队还包括北京大学多媒体信息处理国家重点实验室 ...
在视频理解的 人工智能 领域,一项重要突破正在改变多模态大型语言模型的学习方式。这项研究来自于 新加坡国立大学 和新加坡海洋人工智能实验室的联合团队,由Haonan Wang、Hongfu Liu、Xiangyan Liu、Chao Du、Kenji ...
近日,首尔国立大学的研究团队Jaewoo Ahn、Heeseung Yun、Dayoon Ko和Gunhee Kim在arXiv上发表了一篇引人深思的研究论文,题为《Can LLMs Deceive CLIP? Benchmarking ...
清华大学的研究团队意识到,现有的视频大语言模型主要依赖于CLIP范式预训练的视觉编码器,这些编码器擅长捕捉高级语义内容,但在只有2D视频输入的情况下缺乏结构和空间信息。为了解决这个问题,研究团队提出了一种名为"Spatial-MLLM"的全新方法,它能显著提升现有视频大语言模型的视觉空间智能。
在人工智能视觉语言理解领域,一项重大突破悄然发生。由华中科技大学沈楚明、魏威、屈晓晔和香港中文大学郑宇共同完成的研究《SATORI-R1: Incentivizing Multimodal Reasoning with Spatial ...
早在 2003 年,AI 先驱、LSTM 之父 Jürgen Schmidhuber 就提出过一种名为「哥德尔机(Gödel ...
然而 ReLU 单元易陷入所谓的「死亡 ReLU 问题」, 一旦某个神经元在训练中输出恒为 0,其梯度也为 0,无法再恢复。 这一现象最终制约了其整体效能,也是 ReLU 网络的重大缺陷。
外媒援引知情人士报道称,马斯克旗下的人工智能 (AI)公司xAI正在进行一项价值3亿美元的股份出售交易,此次交易将该公司整体估值定为1130亿美元。知情人士透露,这项交易将允许xAI员工向新投资者出售股份,并确认了xAI此前收购马斯克旗下社交媒体平台X时所达成的估值。今年3月,马斯克合并了xAI和X公司,合并后的新公司估值定为1130亿美元,其中xAI估值为800亿美元,X的估值为330亿美元。
为了解决这一问题,浙江大学联合微软亚洲研究院、香港中文大学提出了 Thought Leap Bridge 任务,并开发了思维链修复方法:CoT-Bridge。实验显示,该方法显著提升了多个数学与逻辑任务中的推理准确率,并能作为 “即插即用” ...
编程智能体也有「进化论」!Transformer作者初创Sakana AI与UBC推出达尔文-哥德尔机(DGM),能自动改写自身代码,性能翻倍超越人工设计。还能跨语言迁移、发明新工具。AI要觉醒了?
对此,西北大学与Google、谷歌DeepMind团队质疑了传统强化学习与反思的关系,并提出了贝叶斯自适应的强化学习方法, 首次解释了为什么、如何、以及何时应该反思并探索新策略 。 通过对比分别使用传统强化学习和新方法训练的模型,研究人员发现: ...