transformers - 搜索 News

资讯

科技行者 on MSN9 小时

说到底，MiniMax-M1代表了AI推理能力发展的一个重要里程碑。通过创新的混合注意力架构和高效的强化学习算法，它成功地解决了长期困扰该领域的计算效率问题。这项工作不仅在技术上实现了突破，更重要的是大幅降低了高性能推理模型的训练和使用成本，让更多研 ...

13 小时

MiniMax团队最近发布的M1模型改变了这个局面。他们创造了世界上第一个开源的大规模混合注意力推理模型，能够让AI在进行长达8万个token（相当于约6万个中文字符）的深度思考时，仍然保持极高的运行效率。而且M1模型支持处理100万个token的超 ...

10 小时

在上文中，我们发现了一个重要的原则：通向超级智能的最佳路径在于文本数据。换句话说，AGI很可能就是LLM，或根本不存在。

该工作第一作者为蚂蚁技术研究院副研究员胡翔，蚂蚁技术研究院高级研究员武威为通讯作者。在大语言模型如火如荼的当下，长文本建模仍然是一个极具挑战的问题。纠其根源，一方面在于主流 LLMs 的架构 Transformers ...

大数据文摘出品近日，国内 AI 初创公司 MiniMax 发布了一款全新的语言大模型 MiniMax-M1。有两个方面最引人注目：1.高达100万Token的上下文处理能力。2.极具竞争力的训练成本效益。M1 那个“1,000,000 token ...

2 天

不是顶会论文，也没有发在 arXiv 上，甚至连“正式发表”都称不上——但就是这样的一篇纯博客文章，却让一名研究员成功拿到了 OpenAI 的 Offer，甚至据说这篇博客的技术还被用于 GPT-5 的训练工作。

4 天

不过，这篇论文的研究方法也受到了不少质疑，比如我们的一位读者就认为「给数学题题干加无关内容，发现大模型更容易答错，而质疑大模型不会推理」的做法并不十分合理。

2 天

人类从农耕时代到工业时代花了数千年，从工业时代到信息时代又花了两百多年，而 LLM 仅出现不到十年，就已将曾经遥不可及的人工智能能力普及给大众，让全球数亿人能够通过自然语言进行创作、编程和推理。

4 天

Thinkless 框架的提出，正是为了打破这一困局。它可以赋予 LLM 一种“情境感知”的能力，使其能够像经验丰富的工匠一样，根据手头任务的复杂度和自身技艺的精湛程度，灵活地选择最合适的工具。

探索游戏界的新热潮！最新改编游戏排行榜揭示了哪些经典IP以令人惊艳的方式重焕生机。从电影到动漫，这些高人气改编作品不仅满足了粉丝的期待，还在游戏中创造了独特的魅力。快来一窥究竟，看看哪款改编游戏荣登榜首，引领潮流风向标。

人人都是产品经理 on MSN3 天

在数字化服务的大潮里，智能客服早已不是锦上添花，而是支撑业务运转、守护用户体验的基石级服务。我见过太多因为智能客服“智障”而流失的用户，也深知一个得力的“智能助手”对平台增长和口碑有多重要。而知识库，正是这颗“智能大脑”的核心引擎。它的构建质量，直接 ...

4 天

在 AI 发展如火如荼的今天，学术界与工业界正以前所未有的速度向前狂奔。但在这片繁荣的背后，似乎有一股潜流正在悄悄侵蚀着研究的本质。美国纽约大学助理教授、CV 领域著名学者、2023 年度《麻省理工科技评论》“35 岁以下科技创新 35 人”中国区入选者谢赛宁（Saining ...

一些您可能无法访问的结果已被隐去。