arXiv—— - 搜索 News

资讯

LegalSearchLM：北大团队打造突破性法律案例检索新方法，将案例检索 ...

LegalSearchLM模型采用了一种全新的方法：将法律案例检索视为法律要素生成任务。当给定一个查询案例时，模型不是简单地寻找相似的文档，而是推理出该案例中的关键法律要素，然后直接生成这些要素，作为查找目标文档的钥匙。

科技行者 on MSN8 小时

NVIDIA研究团队的Mingjie Liu、Shizhe Diao、Ximing Lu、Jian Hu、Xin Dong、Yejin Choi、Jan Kautz和Yi Dong在2025年5月30日发表了一篇名为《ProRL: Prolonged ...

腾讯网12 小时

冲击自回归，扩散模型正在改写下一代通用模型范式

机器之心报道编辑：Panda上个月 21 号，Google I/O 2025 开发者大会可说是吸睛无数，各种 AI 模型、技术、工具、服务、应用让人目不暇接。在这其中，Gemini Diffusion ...

科技行者 on MSN7 小时

un?CLIP：通过反转unCLIP来提升CLIP模型的视觉细节捕捉能力

在人工智能和计算机视觉领域，一种名为CLIP（对比语言-图像预训练）的模型近年来取得了巨大成功，成为了许多视觉和多模态任务的基础。然而，最近的研究表明，CLIP在区分图像中的细节差异方面存在不足，在密集预测和以视觉为中心的多模态任务上表现不佳。针对这 ...

科技行者 on MSN10 小时

从失败中学习：强化蒸馏法让大语言模型更擅长推理

在人工智能研究的最前沿，一项创新研究正在改变我们训练大语言模型（LLM）推理能力的方式。来自国立新加坡大学和上海英飞睿（INFLY ...

腾讯网8 小时

CLaSp：让大语言模型生成文本更快的自我推测解码技术

CLaSp的研究不仅为大语言模型的推理加速提供了一种实用的解决方案，也为我们理解大型神经网络的内部工作机制提供了新的视角。它揭示了大语言模型中存在的层冗余现象，以及如何利用这种冗余来提高计算效率。这些发现对于未来设计更高效的神经网络架构具有重要启示。

科技行者 on MSN1 天

Prot2Token：通过标记预测统一蛋白质建模的全新框架

Prot2Token框架旨在使用基于编码器-解码器变换器的共享架构来统一各种蛋白质相关预测任务。其核心思想是通过交叉注意力层将自回归解码器语言模型与现有的编码器风格蛋白质和可选的化学语言模型集成，从而将预测任务转换为统一的下一个标记预测问题。

十轮网科技资讯 on MSN15 天

AI促进科学创新重要研究遭MIT审查否决，要求arXiv标注撤回

麻省理工学院（MIT）不信任一篇于2024年底公开于arXiv平台的人工智能创新论文，并已请求平台将该论文标注为撤回。该论文由当时MIT经济系博士生Aidan Toner-Rodgers撰写，题目为《Artificial Intelligence, Scientific Discovery, and Product ...