X-3B - 搜索 News

资讯

首先，Time-R1证明了小型模型通过专门训练可以在特定领域超越超大模型。这一发现具有深远的实际意义：较小的模型（如3B参数）可以在时间变化时快速微调以获取新数据，这对于较大的模型（数千亿参数）来说是不可行的，后者需要巨大的计算资源（微调成本可能高达 ...

1 天

在2月份，OPPO推出了全球最薄的大折叠屏手机——OPPO Find N5，折叠屏领域首发骁龙8至尊版，厚度薄至4.21mm（展开）、8.93mm（闭合态），展开后的厚度几乎和Type-C接口差不多。

1 天

免责声明：以上所展示的信息由企业自行提供，内容的真实性、准确性和合法性由发布企业负责，智能制造网对此不承担任何 ...

UniR采用了全新的设计理念：它将推理能力分解为一个独立的轻量级推理模块，这个模块可以与任何冻结的LLM无缝集成，无需了解模型内部结构。更令人惊喜的是，一个在小模型上训练的UniR模块可以有效指导大得多的模型，比如用3B模型训练的推理模块可以指导14 ...

5 天

在实验中， 1.5B和3B的小模型也涌现出与DeepSeek-R1类似的长思维链推理行为。在INTUITOR中，团队发现如果使用离线学习，在训练约100步的时候模型也学会了作弊：在回答中附加一个已经解决的简单问题来提高自信度分数。

3 天

【新智元导读】不靠外部奖励，LLM纯靠「自信爆棚」，就能学会推理了？UC伯克利的华人团队发现，LLM居然跟人一样！靠自信来训练AI后，数学、编程性能提升惊人。

科技行者 on MSN5 天

在人工智能快速发展的今天，大型语言模型（LLMs）的推理能力日益提升，但如何在保持高质量输出的同时降低计算成本，一直是研究者们面临的挑战。2025年5月，来自康奈尔大学、哈佛大学、Netflix以及Databricks的研究团队发表了一篇题为《Val ...

5 天

谷歌DeepMind研究科学家Xidong Feng表示，这篇论文会让一大堆LLM+RL的研究受到质疑。另一位DeepMind科学家Andrew Lampinen称赞道，这确实是一个反常识典型案例。

这一发现意味着，玛巴洛沙韦具有“双向保护作用”，既可以治疗患者的流感（保护患者），还可以降低流感在家庭内传播的风险（保护家庭成员）。毫无疑问，玛巴洛沙韦的这一表现，为我们应对未来的流感大流行带来了新启示。

一些您可能无法访问的结果已被隐去。