资讯
【导读】智源研究院发布开源模型Video-XL-2,显著提升长视频理解能力。该模型在效果、处理长度与速度上全面优化,支持单卡处理万帧视频,编码2048帧仅需12秒。 尽管OpenAI GPT-4o、Google ...
4 天
科技行者 on MSNSVG2: 通过语义感知排列实现视频生成加速,伯克利与MIT团队带来视频 ...近日,由加州大学伯克利分校、麻省理工学院(MIT)和斯坦福大学的研究团队联合发布了一项名为"Sparse VideoGen2: Accelerate Video Generation with Sparse Attention via ...
长视频理解是多模态大模型关键能力之一。尽管OpenAI GPT-4o、Google ...
机器之心发布机器之心编辑部长视频理解是多模态大模型关键能力之一。尽管 OpenAI GPT-4o、Google Gemini ...
并引入谱-空间加权因子来增强丰度矩阵的行稀疏性,同时保持图像的连续性,避免超像素分割可能导致的不准确混合结果。 Sparse unmixing has made great progress in hyperspectral unmix-ing recently. To improve the unmixing accuracy, spatial information has been ...
29日下午,央视网发布了一段时长约10秒的短视频,画面中展现了我军歼16战斗机的飞行动态以及飞行员简洁而意味深长的汇报:“目标信号消失,判定已摧毁。”这一短暂却引人深思的画面瞬间激起了众多网友的热烈讨论,大家纷纷揣测这个被摧毁的目标到底是什么。
【新智元导读】北大DeepSeek联合发布的NSA论文,目前已被ACL 2025录用并获得了极高评分,甚至有望冲击最佳论文奖。该技术颠覆传统注意力机制,实现算力效率飞跃,被誉为长文本处理的革命性突破。
2 天
一点资讯 on MSN科学家提出视频扩散模型加速方法,在H100实现一倍以上端到端加速近日,南京理工大学本科校友、美国西北大学沈轩博士生和所在团队提出一种全新的加速视频扩散模型的方法,名为 Draft Attention。 图 | 沈轩(来源:沈轩) 这一方法的核心创新在于:研究团队首先将隐藏空间中的 tokens ...
ChatGPT「舔狗化」事件背后,暴漏目前AI仍是「黑箱」。一场关于「机制可解释性」的路线分歧,正撕裂AI研究最核心的价值共识。谷歌认怂,Anthropic死磕——AI还能被「看懂」吗?
当前具身智能研发正面临“双重枷锁”:一方面,真机验证成本高、仿真偏差大,制约策略验证效率;另一方面,海量真机数据尚未构建基于轨迹扩增的高效利用机制,导致数据未被充分利用,制约了模型的持续进化。为打破这一困局,智元机器人在去年发布的机器人 4D ...
ALI的巧妙之处在于,它并没有试图直接“磨平”散射造成的模糊,而是利用了神经元活动本身的一个关键特性:尽管神经元在空间上分布密集且信号重叠,但在任何给定时刻,只有少数神经元会发射动作电位。这种稀疏激活(sparse ...
4月30日凌晨Dee pS eek更新Prover-V2大模型,据多方消息透露,国内AI技术领军企业深度求索 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果