LLM - 搜索 News

资讯

5 小时

DeepSeek在MoE和MLA方面的突破，标志着大规模LLM在边缘部署方式的根本性转变。通过优化计算和内存需求，这些创新为边缘AI应用开辟了新的可能性。移动和可穿戴设备上增强型实时AI助手、L4和L5自动驾驶、具有低延迟推理的更智能工业自动化，以及 ...

2 天

LeCun新作：LLM难懂“鸟”类概念，**大模型**认知瓶颈何在？

LeCun 团队的核心发现指出，虽然 LLM 在粗粒度的概念分类任务上表现出色，例如识别“鸟类”或“家具”，但它们在理解细粒度语义，如“知更鸟”比“企鹅”更像鸟类等问题上，却显得力不从心。这与人类的认知方式存在本质差异，人类能够通过上下文、 ...

红板报 on MSN2 天

首次解释LLM如何推理反思！西北大学谷歌新框架：引入贝叶斯自适应 ...

BARL团队投稿量子位 | 公众号 QbitAI 推理模型常常表现出类似自我反思的行为，但问题是—— 这些行为是否真的能有效探索新策略呢？对此，西北大学与Google、谷歌DeepMind团队质疑了传统强化学习与反思的关系，并提出了贝叶斯自适应的强化学习方法，首次解释了为什么、如何、以及何时应该反思并探索新策略。通过对比分别使用传统强化学习和新方法训练的模型，研究人员发现：在完成“模型需要 ...

1 天

UC伯克利新作颠覆认知：LLM靠「自信爆表」学会推理？无需外部奖励 ...

然后，他们就得出了一个关键的洞察：衡量每个token的分布距离均匀分布有多远。KL散度KL (U‖P) ，可以量化模型在预测每个token时的「自信程度」。可以将这一度量称为「自我确定性」。

腾讯网2 天

揭秘指令特定神经元与专家：一个分析LLM指令跟随能力的全新框架

SPARCOM框架是这项研究的核心创新，它提供了一种系统化的方法来分析LLM内部的稀疏组件。这个框架就像是一台特殊的显微镜，能够让研究人员透视LLM的"大脑"，观察它在处理不同指令时的内部活动。

1 天

企业为何需要将基于UI的自动化与基于 LLM的自动化相结合？

LLM自动化革新了人机交互模式，但其技术成熟度和安全性局限使其短期内难以取代UI自动化。未来，企业需根据场景需求选择技术组合：LLM用于敏捷、低代码的灵活需求，UI自动化确保核心流程的精准与安全 ...

腾讯网1 天

ACL2025 | 传统符号语言传递知识太低效？探索LLM高效参数迁移可行性

人类的思维是非透明的，没有继承的记忆，因此需要通过语言交流的环境来学习。人类的知识传递长期依赖符号语言：从文字、数学公式到编程代码，我们通过符号系统将知识编码、解码。但这种方式存在天然瓶颈，比如信息冗余、效率低下等。

3 天

Claude 团队打开大模型“脑回路”，推出开源 LLM 思维可视化工具

Claude 团队来搞开源了 —— 推出“电路追踪”（circuit tracing）工具，可以帮大伙儿读懂大模型的“脑回路”，追踪其思维过程。该工具的核心在于生成归因图（attribution graphs），其作用类似于大脑的神经网络示意图，通过可视化模型内部超节点及其连接关系，呈现 LLM 处理信息的路径。

14 天

策略学习助力LLM推理效率：MIT与谷歌团队提出异步并行生成新范式

研究团队不依赖人工设计规则来识别异步生成机会，而通过策略学习让模型自主发现并标注这些机会，系统地优化质量与速度的平衡。这种方法使 LLM 根据内容特点自适应地确定最佳异步生成策略，为生成效率优化开创学习驱动的全新路径。

8 天

红帽联手谷歌、NVIDIA启动llm-d开源项目，破解大规模AI推理成本与延迟 ...

全球开源解决方案领导者红帽公司近日宣布启动革命性开源项目llm-d，专门应对生成式AI大规模推理的迫切需求。该项目汇聚了CoreWeave、Google Cloud、IBM ...

InfoQ中国 on MSN7 天

LLM 驱动的 Go 到 Rust 项目迁移的挑战与实践

随着 LLM 不断发展、功能逐渐强大，我们发现可以基于 LLM 做很多具有挑战性的应用。比如，当我们公司内正在切换语言栈，那么基于 LLM 进行现有项目的迁移，无疑是一个高效的方式；特别是从 Go 语言迁移到 Rust ...

当前正在显示可能无法访问的结果。

隐藏无法访问的结果