fine-tune - 搜索 News

4 小时

今年春节DeepSeek引爆有关生成式AI更低成本实现的话题之后，包括NVIDIA在内的AI相关企业股价纷纷下跌，连能源板块都受影响。市场基于直觉认为，此前老黄说要建大量大规模AI数据中心的想法不成立了。在DeepSeek诞生以后，媒体和资本市场有关 ...

1 天

CBN丨Lisa Su vs. Jensen Huang: The epic AI chip battle heating up

On Tuesday, ahead of Huang’s keynote address, "Queen of AI Semiconductors" Lisa Su made a bold move in Beijing. Su revealed ...

17 小时

引领未来！AI技术将如何改变程序员的职业命运？

随着2025年的到来，AI技术正在飞速发展，彻底改变着程序员的职业景观。从阿里云的核心业务全面接入Agent体系，到字节跳动要求30%后端岗位具备大模型开发能力，各大互联网巨头如腾讯、京东、百度纷纷开放与AI相关的技术岗招聘，市场需求正悄然转变。

中时新闻网20 小时

《半导体》群联升级aiDAPTIV+扩展边缘AI应用支援NVIDIA Jetson平台

群联(8299)宣布其边缘AI训练与推论解决方案aiDAPTIV+再度升级，提供更多扩充能力。aiDAPTIV+将整合进Maingear的ML系列笔电，这款AI笔电将成为全球首款支援LLMOps（大型语言模型运作业）的消费级笔电。使用者可以利用 ...

6 天

国内首个！千帆ModelBuilder支持RFT，实现思维跃迁，超OpenAI o1

在OpenAI连续12天的技术发布会上,一项名为RFT(Reinforcement-basedFine-Tuning,基于强化学习的微调)的新型训练方法引发全球关注。该方法通过结合强化学习与监督微调,仅需少量标注数据即可显著提升模型在特定场景下的 ...

来自MSN15 天

显著超越SFT，o1/DeepSeek-R1背后秘诀也能用于多模态大模型了

Visual-RFT团队投稿量子位 | 公众号 QbitAI o1/DeepSeek-R1背后秘诀也能扩展到多模态了！举个例子，提问多模态大模型：“什么宝可梦可以释放技能十万伏特”时，模型通过这是来自上海交大、上海AI ...

6 天

国内首个突破！千帆ModelBuilder实现RFT训练，反超OpenAI o1

在OpenAI连续12天的技术发布会上，一个名为RFT（Reinforcement-based Fine-Tuning，基于强化学习的微调）的新型训练方法引起了全球的广泛关注。RFT方法通过将强化学习与监督微调相结合，利用少量标注数据，显著提升模型在特定场景下的表现。最近，百度智能云千帆ModelBuilder荣登国内首个全面支持RFT训练方式的大模型开发平台。这一突破不仅为企业开发者提供了更高效 ...

6 天

国内首个！千帆ModelBuilder支持RFT，打破传统SFT训练效果天花板，模型 ...

在OpenAI连续12天的技术发布会上,一项名为RFT (Reinforcement-based ...

腾讯网3 天

四川大学提出Test-time Adaptation新范式，突破查询偏移挑战

在 NeurIPS 2024 大会上，OpenAI 联合创始人兼前首席科学家 Ilya Sutskever 在其主题报告中展望了基础模型的未来研究方向，其中包括了 Inference Time Compute ...

7 天

CMU 团队推出元强化微调：提升大语言模型推理能力的新范式

在人工智能领域，大语言模型（LLM）正在不断进化，最近，卡内基梅隆大学 (CMU)与 HuggingFace 的研究者们共同提出了一种名为 “元强化微调” (Meta Reinforcement Fine-Tuning，简称 MRT)的新方法。这一方法旨在优化大语言模型在测试时的计算效率，尤其是在解决复杂推理问题时，表现尤为突出。研究表明，现有的大语言模型在推理过程中常常消耗过多的计算资源，而 ...

3 天

受 DeepSeek-R1 启发，小米大模型团队登顶音频推理 MMAU 榜

IT之家 3 月 17 日消息，@小米技术官微今日发文称，小米大模型团队在音频推理领域取得突破性进展。受 DeepSeek-R1 启发，团队率先将强化学习算法应用于多模态音频理解任务，仅用一周时间便以 64.5% 的 SOTA 准确率登顶国际权威的 MMAU 音频理解评测榜首，现同步开源。面对一段汽车行驶中的座舱录音，AI 能否判断出汽车是否存在潜在的故障？在交响乐演出现场，AI ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果