Model Training - 搜索 News

9 小时

上周，中国公司 DeepSeek 发布了一款名为 R1 的大型语言模型，震惊了美国科技行业。R1 不仅能与本土竞争对手相媲美，而且成本仅为其一小部分，而且免费提供。美国股市因此损失了 1 ...

PyTorch生态系统中的连续深度学习：使用Torchdyn实现连续时间神经网络

点击上方“Deephub Imba”,关注公众号,好文章不错过 !神经常微分方程（Neural ODEs）是深度学习领域的创新性模型架构，它将神经网络的离散变换扩展为连续时间动力系统。与传统神经网络将层表示为离散变换不同，Neural ...

腾讯网7 小时

FF将于3月10日更换股票代码为FFAI 3月17日举行“FF开放AI日” 持续释放 ...

· 在今天闭幕的2025格莱美音乐大奖上，FF车主和共创官、全球超级巨星Chris Brown时隔十年，斩获了个人音乐生涯的第二个格莱美大奖——最佳R&B专辑。他通过坚持努力和绝不放弃，重回巅峰，王者归来。在此，我们对Chris Brown和他“Never give up，Never give in”的精神和成就表示祝贺，愿FF和Chris ...

1 天

DeepSeek火爆引争议，中国AI“软、硬”挑战犹存亟待破局

近日，DeepSeek在AI大模型领域引发热议，凭借其惊人的性能表现和低成本训练模式，迅速吸引了全球关注。虽然市场上几乎充满了赞叹声，但理性的业内人士已经开始提出质疑，认为这一现象可能并非一蹴而就，值得等待更多的验证。

腾讯网8 天

AI 2025 的硅谷答案：60 条关键洞察

重塑世界的力量不在硅谷，而在一代中国从业者的努力中。来源：石头学习笔记(ID:notes2024)原标题：AI 2025的硅谷答案：60条关键洞察编者按：2024 年末国内大模型公司的组团推新品，让人们看到了 AI 依旧火热。在硅谷，AI 从业者们在热烈讨论后，总结出了 2025 年，AI ...

6 天on MSN

这是激进投资AI的锦秋基金，从硅谷带回的二十五条关键认知

作为这个活动背后的攒局者，锦秋基金不仅投资了北美的一些活跃的AI基金，与全球AI市场建立连接，也特别推出了Soil种子计划，以激进的、快速灵活决策的方式支持AI领域的早期创业者。过去的2024年，锦秋频繁出手了AI达人营销平台Aha ...

3 天

LLM大模型训练工具，小白也能轻松搞定！

支持大语言模型 LLM、多模态图文模型 VLM 的预训练及轻量级微调。XTuner 支持在 8GB 显存下微调 7B 模型，同时也支持多节点跨设备微调更大尺度模型（70B+）。

来自MSN12 天

如何评价 DeepSeek 正式发布的 DeepSeek-R1与DeepSeek-R1-Zero模型？

力大砖飞，简洁优雅。我觉得最大的价值是证明了：基于一个很强的模型（deepseekv3-base），用最简单的rule-based reward来做rl，经过大量训练（8k steps * bs 512/1024），也能达到目前reasoning ...

SHINE5 天

Former Google CEO calls DeepSeek "turning point" for AI race

Former Google CEO Eric Schmidt described DeepSeek's rise as "a turning point" in the global artificial intelligence (AI) race ...

6 天

Most rainforests too degraded to provide good habitats 多数雨林退化严重而无法为 ...

Modern life makes us tired, right? But research from societies in Africa and South America suggests people in the ancient world slept only 6.5 hours a night.

13 天

追平满血版o1的国产多模态模型终于来了！训练细节全部公开

春节前最后一周，能媲美 Open AI 满血版 o1（Full Version，而非 preview）的模型终于出现了！刚刚，月之暗面公布了他们的 Kimi k 系列模型最新版本 ——k1.5 ...

17 天

2025，AI重塑药物研发的三个方向

在不久前的峰瑞资本2024年投资人年度峰会上，晶泰科技联合创始人/首席创新官赖力鹏发表了题为《 AI在药物创新中的价值和未来机会》的演讲，深入探讨了AI与生物制药在碰撞发展中创造的新可能，他提到的话题包括：具体而言，药物研发通常会面临 “ 三个10”的困境：研发周期超过10年，投资超过10亿美元，成功率不到10%。医药领域还有一个著名的 “ 反摩尔定律 ” ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果