Instruct - 搜索 News

专注AIGC领域的专业社区，关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型（LLM）的发展和应用落地，聚焦LLM的市场研究和AIGC开发者生态，欢迎关注！今天凌晨，知名大模型训练、开发平台Predibase发布了，首个端到端强化微调平台（ ...

13 小时on MSN

Predibase发布端到端强化微调平台，开启AI大模型训练新篇章

近日，Predibase平台宣布了一项重大创新，正式推出了业内首个端到端的强化微调平台（RFT），这一消息迅速在AI领域引起了广泛关注。

13 小时

感谢DeepSeek：Predibase发布全球首个端到端强化微调平台并开源

Predibase表示，DeepSeek-R1的开源在全球AI领域产生了巨大影响，让很多人意识到强化学习微调对训练大模型的重要性。受此启发，他们开发了这个端到端无服务器强化微调平台。

9 小时

阿里通义大模型持续霸榜，中国AI开源双雄鼎立

最新的进展是，3月6日阿里云发布并开源了全新推理模型通义千问QwQ-32B，该模型用更小的参数但在数学、代码及通用能力上整体比肩DeepSeek-R1，在开源当日就登顶了全球主流AI开源社区Hugging ...

大江网1 天

简单又安全用酷睿AI PC实现零门槛本地AI助手部署

同时，基于英特尔酷睿Ultra系列处理器打造的AI PC，可以说是性能体验最好、稳定性最好、兼容性最好的本地化AI部署平台。Ollama、Flowy、LM Studio、Miniforge等常用软件全部支持，并且支持Intel ...

中文科技资讯12 小时

感谢 DeepSeek：Predibase 发布全球首个端到端强化微调平台并开源，支持 ...

昨日晚间，大模型训练、开发平台 Predibase 发布了一个完全托管、无服务器、端到端的强化微调平台，也是首个端到端强化微调 (RFT)平台。 Predibase 表示，DeepSeek-R1 的开源在全球 AI 领域产生了巨大影响，让很多人意识到强化学习微调对训练大模型的重要性。受此启发，他们开发了这个端到端无服务器强化微调平台。与传统的监督式微调相比，RFT ...

8 小时on MSN

AI存储时代 Arm准备好了！三管齐下软硬兼施

近日在深圳举办的MemoryS 2025闪存峰会上，存储行业的众多龙头企业纷纷登台亮相，Arm的出现则可能让很多人感到意外。

腾讯网10 小时

240元打造擅长数学的多模态版R1，基于DeepSeek核心思想

在典型智能体应用场景验证中，研究团队选取推箱子任务作为评估基准。该任务要求模型同步处理视觉空间解析、目标匹配、动态路径规划等多模态推理能力，对智能体在现实场景中的决策能力具有重要指示意义。经LMM-R1框架强化后的模型，仅通过初始画面即可完成完整动作 ...

6 小时

砍掉99%采样成本，腾讯AI Lab提出大模型无监督训练新技术

腾讯AI Lab与香港中文大学（深圳）合作开展了一项新研究，提出了这样一种名为无监督前缀微调（UPFT）的方法。团队研究发现，关键的正确推理信号，全都藏在模型的“前几步”里，将这种现象称为“推理前序自一致性”。

腾讯网2 天

性能超GPT-4o Mini！24B参数大模型Mistral Small 3.1正式发布

整理 | 屠敏出品 | CSDN（ID：CSDNnews）在大模型时代，很多初创公司的技术实力并不逊色于大厂。今天，法国 AI 初创公司 Mistral AI 正式发布了一款新的开源模型——Mistral Small ...

2 天

AMD顶级APU展现实力！锐龙AI Max+ 395跑DeepSeek R1：比RTX 5080快3倍以上

RTX 5080显卡仅配备16GB的VRAM，这在处理大型语言模型时成为明显的瓶颈，而Strix Halo APU的128GB统一内存可以灵活分配，最多可将96GB内存转换为显存，使其在处理大型AI模型时具备显著优势。

2 天on MSN

AMD锐龙AI Max+ 395 APU大显身手，DeepSeek R1测试中秒杀RTX 5080

AMD近期揭晓了其锐龙AI MAX+ 395 “Strix Halo” APU在DeepSeek R1 AI基准测试中的卓越表现，这一成绩远超NVIDIA RTX 5080桌面版显卡，性能提升幅度超过3倍。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果