Instruct - 搜索 News

6 小时

腾讯AI Lab与香港中文大学（深圳）合作开展了一项新研究，提出了这样一种名为无监督前缀微调（UPFT）的方法。团队研究发现，关键的正确推理信号，全都藏在模型的“前几步”里，将这种现象称为“推理前序自一致性”。

13 小时

3月20日消息，Predibase大模型训练及开发平台在昨晚公布了一项革命性突破：全球首个端到端的强化微调平台（RFT）。Predibase表示，DeepSeek-R1的开源，使得强化学习微调的重要性显著浮现，推动了他们开发这一无服务器强化微调平台。

13 小时

Predibase发布端到端强化微调平台，开启AI大模型训练新篇章

近日，Predibase平台宣布了一项重大创新，正式推出了业内首个端到端的强化微调平台（RFT），这一消息迅速在AI领域引起了广泛关注。

13 小时

感谢DeepSeek：Predibase发布全球首个端到端强化微调平台并开源

Predibase表示，DeepSeek-R1的开源在全球AI领域产生了巨大影响，让很多人意识到强化学习微调对训练大模型的重要性。受此启发，他们开发了这个端到端无服务器强化微调平台。

16 小时

感谢 DeepSeek：Predibase 发布全球首个端到端强化微调平台并开源，支持 ...

昨日晚间，大模型训练、开发平台 Predibase 发布了一个完全托管、无服务器、端到端的强化微调平台，也是首个端到端强化微调（RFT）平台。 Predibase 表示，DeepSeek-R1 的开源在全球 AI ...

腾讯网20 小时

比DeepSeek、o1高3倍！首创无服务器强化微调，只需十几个数据点，

专注AIGC领域的专业社区，关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型（LLM）的发展和应用落地，聚焦LLM的市场研究和AIGC开发者生态，欢迎关注！今天凌晨，知名大模型训练、开发平台Predibase发布了，首个端到端强化微调平台（ ...

大江网1 天

简单又安全用酷睿AI PC实现零门槛本地AI助手部署

同时，基于英特尔酷睿Ultra系列处理器打造的AI PC，可以说是性能体验最好、稳定性最好、兼容性最好的本地化AI部署平台。Ollama、Flowy、LM Studio、Miniforge等常用软件全部支持，并且支持Intel ...

红板报 on MSN1 天

AMD开源30亿小参数模型，媲美Qwen-2.5

AMD在官网开源了最新小参数模型Instella-3B。比较特别的是，这是一个基AMD Instinct™ MI300X GPU从头训练的模型。根据测试数据显示，Instella-3B的性能超过了Llama-3.2-3B、Gemma-2-2B，可以媲美阿里开源的Qwen-2.5-3B，这也证明了AMD的GPU也能训练出高性能的大模型。开源地址：https://huggingface.co/am ...

3 天on MSN

大多数AI在读取时钟与计算日期方面都很吃力错误率甚至高达75%

生成式人工智能工具能够执行那些曾经似乎是科幻小说中的任务，但它们中的大多数在许多基本技能方面仍然很吃力，包括阅读模拟时钟和日历。

腾讯网6 天

MM-Eureka：极少数据实现多模态推理的R1-Zero时刻

尽管 DeepSeek-R1 在单模态推理中取得了显著成功，但已有的多模态尝试（如 R1-V、R1-Multimodal-Journey、LMM-R1）尚未完全复现其核心特征。例如，R1-V ...

红板报 on MSN6 天

AI能自主出“竞赛题”了！港大&蚂蚁让大模型学会生成难题，水平已 ...

赵学亮投稿量子位 | 公众号 QbitAI 大模型架构研究进展太快，数据却快要不够用了，其中问题数据又尤其缺乏。为此，港大和蚂蚁的研究人员反向利用思维链，提出了PromptCoT方法，并基于Llama3.1-8B训练了一个问题生成模型。实验结果表明，合成的问题难度较开源数据和已有算法有显著提升，接近了AIME水平。研究团队利用问题生成模型构造了400k SFT数据。基于这份数据，团队训练 ...

IT之家28 天

联发科推出两款多模态轻量级 AI 模型：主打繁体中文处理能力、基于 ...

在繁体中文处理能力方面，联发科提供的对比显示，相较于参数量相同的 Llama 3.2 3B Instruct 模型，Llama-Breeze2-3B 在撰写关于台北夜市的小短文时，能够准确列举出士林夜市、饶河街夜市和罗东夜市等当地知名夜市，而 Llama 3.2 3B Instruct 模型仅正确提及士林夜市 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果