上周,中国公司 DeepSeek 发布了一款名为 R1 的大型语言模型,震惊了美国科技行业。R1 不仅能与本土竞争对手相媲美,而且成本仅为其一小部分,而且免费提供。美国股市因此损失了 1 ...
点击上方“Deephub Imba”,关注公众号,好文章不错过 !神经常微分方程(Neural ODEs)是深度学习领域的创新性模型架构,它将神经网络的离散变换扩展为连续时间动力系统。与传统神经网络将层表示为离散变换不同,Neural ...
· 在今天闭幕的2025格莱美音乐大奖上,FF车主和共创官、全球超级巨星Chris Brown时隔十年,斩获了个人音乐生涯的第二个格莱美大奖——最佳R&B专辑。他通过坚持努力和绝不放弃,重回巅峰,王者归来。在此,我们对Chris Brown和他“Never give up,Never give in”的精神和成就表示祝贺,愿FF和Chris ...
近日,DeepSeek在AI大模型领域引发热议,凭借其惊人的性能表现和低成本训练模式,迅速吸引了全球关注。虽然市场上几乎充满了赞叹声,但理性的业内人士已经开始提出质疑,认为这一现象可能并非一蹴而就,值得等待更多的验证。
重塑世界的力量不在硅谷,而在一代中国从业者的努力中。来源:石头学习笔记(ID:notes2024)原标题:AI 2025的硅谷答案:60条关键洞察编者按:2024 年末国内大模型公司的组团推新品,让人们看到了 AI 依旧火热。在硅谷,AI 从业者们在热烈讨论后,总结出了 2025 年,AI ...
作为这个活动背后的攒局者,锦秋基金不仅投资了北美的一些活跃的AI基金,与全球AI市场建立连接,也特别推出了Soil种子计划,以激进的、快速灵活决策的方式支持AI领域的早期创业者。过去的2024年,锦秋频繁出手了AI达人营销平台Aha ...
支持大语言模型 LLM、多模态图文模型 VLM 的预训练及轻量级微调。XTuner 支持在 8GB 显存下微调 7B 模型,同时也支持多节点跨设备微调更大尺度模型(70B+)。
力大砖飞,简洁优雅。 我觉得最大的价值是证明了:基于一个很强的模型(deepseekv3-base),用最简单的rule-based reward来做rl,经过大量训练(8k steps * bs 512/1024),也能达到目前reasoning ...
Former Google CEO Eric Schmidt described DeepSeek's rise as "a turning point" in the global artificial intelligence (AI) race ...
Modern life makes us tired, right? But research from societies in Africa and South America suggests people in the ancient world slept only 6.5 hours a night.
春节前最后一周,能媲美 Open AI 满血版 o1(Full Version,而非 preview)的模型终于出现了! 刚刚,月之暗面公布了他们的 Kimi k 系列模型最新版本 ——k1.5 ...
在不久前的峰瑞资本2024年投资人年度峰会上,晶泰科技联合创始人/首席创新官 赖力鹏 发表了题为《 AI在药物创新中的价值和未来机会 》的演讲,深入探讨了AI与生物制药在碰撞发展中创造的新可能,他提到的话题包括: 具体而言,药物研发通常会面临 “ 三个10”的困境 : 研发周期 超过10年, 投资 超过10亿美元, 成功率 不到10%。医药领域还有一个著名的 “ 反摩尔定律 ” ...