近日,Predibase平台宣布了一项重大创新,正式推出了业内首个端到端的强化微调平台(RFT),这一消息迅速在AI领域引起了广泛关注。
Prediba se表示,DeepSeek-R1的开源在全球AI领域产生了巨大影响,让很多人意识到强化学习微调对训练大模型的重要性。受此启发,他们开发了这个端到端无服务器强化微调平台。