资讯
LegalSearchLM模型采用了一种全新的方法:将法律案例检索视为法律要素生成任务。当给定一个查询案例时,模型不是简单地寻找相似的文档,而是推理出该案例中的关键法律要素,然后直接生成这些要素,作为查找目标文档的钥匙。
8 小时
科技行者 on MSN持久强化学习让大语言模型突破推理边界:NVIDIA研究团队解锁新型 ...NVIDIA研究团队的Mingjie Liu、Shizhe Diao、Ximing Lu、Jian Hu、Xin Dong、Yejin Choi、Jan Kautz和Yi Dong在2025年5月30日发表了一篇名为《ProRL: Prolonged ...
机器之心报道编辑:Panda上个月 21 号,Google I/O 2025 开发者大会可说是吸睛无数,各种 AI 模型、技术、工具、服务、应用让人目不暇接。在这其中,Gemini Diffusion ...
7 小时
科技行者 on MSNun?CLIP:通过反转unCLIP来提升CLIP模型的视觉细节捕捉能力在人工智能和计算机视觉领域,一种名为CLIP(对比语言-图像预训练)的模型近年来取得了巨大成功,成为了许多视觉和多模态任务的基础。然而,最近的研究表明,CLIP在区分图像中的细节差异方面存在不足,在密集预测和以视觉为中心的多模态任务上表现不佳。针对这 ...
10 小时
科技行者 on MSN从失败中学习:强化蒸馏法让大语言模型更擅长推理在人工智能研究的最前沿,一项创新研究正在改变我们训练大语言模型(LLM)推理能力的方式。来自国立新加坡大学和上海英飞睿(INFLY ...
CLaSp的研究不仅为大语言模型的推理加速提供了一种实用的解决方案,也为我们理解大型神经网络的内部工作机制提供了新的视角。它揭示了大语言模型中存在的层冗余现象,以及如何利用这种冗余来提高计算效率。这些发现对于未来设计更高效的神经网络架构具有重要启示。
1 天
科技行者 on MSNProt2Token:通过标记预测统一蛋白质建模的全新框架Prot2Token框架旨在使用基于编码器-解码器变换器的共享架构来统一各种蛋白质相关预测任务。其核心思想是通过交叉注意力层将自回归解码器语言模型与现有的编码器风格蛋白质和可选的 化学 语言模型集成,从而将预测任务转换为统一的下一个标记预测问题。
十轮网科技资讯 on MSN15 天
AI促进科学创新重要研究遭MIT审查否决,要求arXiv标注撤回麻省理工学院(MIT)不信任一篇于2024年底公开于arXiv平台的人工智能创新论文,并已请求平台将该论文标注为撤回。该论文由当时MIT经济系博士生Aidan Toner-Rodgers撰写,题目为《Artificial Intelligence, Scientific Discovery, and Product ...
论文中介绍称,理论上,QKD协议可以在卫星通信系统固有的高信道损耗情况下,实现基于弱相干脉冲的长距离安全量子密钥分发。然而,众所周知,实际的QKD设备可能因实施中的缺陷而容易受到各种类型的旁道攻击。
早在 2003 年,AI 先驱、LSTM 之父 Jürgen Schmidhuber 就提出过一种名为「哥德尔机(Gödel ...
4、 对比分析详尽:对OpenAI-o3、GPT-4o、Claude-3.7、Gemini2.5-Pro等模型进行系统评估;人类解题成功率高达93.3%, 最强模型OpenAI-o3仅为40.0% ;并从策略偏差、视觉错误、执行失败等维度剖析失败原因 ...
1 天
科技行者 on MSN微软研究院重大突破:更稳定高效的大语言模型强化学习算法—OPO ...在人工智能领域,特别是大语言模型的训练与优化上,一项重要的研究成果于2025年5月29日由微软研究院的研究团队发布在arXiv预印本平台上。这项名为《基于最优奖励基线的在策略强化学习》(On-Policy RL with Optimal Reward ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果