资讯
Uni-Instruct的核心创新在于提出了一个基于理论的统一框架,能够将10多种现有的单步扩散蒸馏方法统一起来。就像发现了不同厨师秘方背后的共同烹饪原理一样。这个框架基于研究团队提出的"f-散度族的扩散扩展理论"(diffusion ...
在2025年5月25日发布于arXiv预印本平台的研究论文《基于影响力蒸馏的高效大规模数据选择》中,来自ISTA(Institute of Science and Technology Austria)和谷歌研究院的Mahdi ...
为了解决这一问题,浙江大学联合微软亚洲研究院、香港中文大学提出了 Thought Leap Bridge 任务,并开发了思维链修复方法:CoT-Bridge。实验显示,该方法显著提升了多个数学与逻辑任务中的推理准确率,并能作为 “即插即用” ...
2 天
科技行者 on MSN消除视觉噪点:香港大学团队开创自蒸馏寄存器让视觉Transformer产生 ...视觉是我们感知世界的重要方式,而计算机视觉则是让机器"看懂"世界的关键技术。随着深度学习的发展,视觉Transformer(ViT)模型已经成为计算机视觉领域的主流架构。这篇由浙江大学的陈银杰、香港大学的严子鹏和罗安德鲁以及南洋理工大学的周冲共同完成 ...
2 天
科技行者 on MSNAlphaMed:突破医疗AI推理极限,来自帝国理工学院的创新研究无需蒸馏 ...医疗领域的人工智能正在经历一场安静的革命。2025年5月,帝国理工学院的刘彻、香港科技大学的王浩哲、慕尼黑工业大学的潘家臻等研究人员在arXiv(arXiv:2505.17952v1)上发表了一项突破性研究:《Beyond Distillation: ...
8 天
科技行者 on MSN谁才是真正的好老师?北科研团队比较不同推理蒸馏源对大语言模型 ...这项由北科(Beike)内部研究团队a-m-team在2025年5月发表于arXiv(arXiv:2505.14464v1)的研究探讨了一个有趣而重要的问题:在大语言模型的知识蒸馏过程中,"教师模型"的选择到底有多重要?就像在学校里,不同的老师教同一 ...
12 天
一点资讯 on MSN20年未解的数学难题被破了,“纠缠蒸馏”终于有了清晰的计算方式量子圈最近传来一个大消息,表面看是数学推导,其实背后是整个量子技术的关键突破。 事情的主角是日本理化学研究所的数学物理学家Bartosz Regula和阿姆斯特丹大学的Ludovico ...
今天给大家介绍一篇使用大语言模型结合知识蒸馏方法,构建高效轻量级时间序列预测模型的方法。文中基于大语言模型通过多模态建模优化适配到时间序列数据,并进一步通过优势知识蒸馏将大模型信息蒸馏到小模型中,实现模型尺寸不变而具备大模型知识的 ...
铜鸮卣率先映入观众眼帘。“这件文物于2010年在济南大辛庄遗址出土,是一件盛酒器。其内部存留液体,经检测证实为距今约3000年的蒸馏酒,填补了商代至汉代中国蒸馏酒的空白。”济南市博物馆陈列展览部工作人员刘子琪向记者揭秘道。 据了解,铜鸮卣在 ...
5月15日,京东探索研究院论文《Omniforce:以人为中心的、赋能大模型的、云边协同的自动机器学习系统》发表于《Nature》旗下期刊《npj Artificial ...
采取了“大带小”的模式,从大号模型中蒸馏数据训练小号模型。 有已经读完报告的网友,还发现了其中的更多亮点。 比如这位Hugging Face研究员 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果