Learning Treainee - 搜索 News

资讯

China Focus: China strengthens space technology cooperation with Global South nations

"Thanks to China's support for Thailand in the space technology field, the cooperation with China has promoted the rapid development of Thailand's space industry," Atipat said.

2 小时

业内首次! 全面复现DeepSeek-R1-Zero数学代码能力，训练步数仅需其1/10

4月23日,快手Kwaipilot团队发布全新大模型训练方法SRPO并宣布开源。该方法仅用 GRPO 1/10的训练成本,在数学与代码双领域基准测试中实现性能突破:AIME2024 得分50,LiveCodeBench ...

China.org.cn15 小时

Feature: Young Pakistani experts turn to China for agricultural solutions

In Pakistan's southwestern Balochistan province, Nazeer Ahmad Bandija is pursuing similar goals. A lecturer at Lasbela University of Agriculture, Water & Marine Sciences, Bandija is focused on ...

3 小时

TTS和TTT已过时？TTRL横空出世，推理模型摆脱「标注数据」依赖，性能 ...

测试时缩放（TTS，Test-Time Scaling）是一种提升大语言模型推理能力的新兴策略，通过在测试阶段优化推理过程（如多数投票、蒙特卡洛树搜索等）提升大型语言模型（LLMs）的性能，而无需修改模型参数。

6 小时

梁世杰医生：重塑中医的疾病观——从辨证分型到病程动态的整体把握

梁世杰医生进一步阐述，中医现代化并非意味着摒弃传统，而是要在继承的基础上创新。他提倡运用现代科技手段，如大数据分析、人工智能等，辅助中医进行疾病诊断与治疗，使中医的“整体观念”更加精准、高效。同时，加强中医教育与培训，提升医生对疾病过程状态的认知与把 ...

9 小时

被《经验时代》刷屏之后，剑桥博士长文讲述RL破局之路

PhD 这些年即将告一段落，这几个月梳理先前的工作，准备 Tutorial，借鉴了不少去年从 RLC 上听 David Silver 讲过的思想，在这个 “RL Finally Generalizes (Shunyu Yao)” 的时代到来之际，也一直想写一篇文章作为整理，恰好最近读 Silver 和 Sutton 一起写的《经验时代》 (Welcome to the era of ...

腾讯网18 小时

普林斯顿大学教授王梦迪：大模型推理与Al for Science

在AI for Science环节中，普林斯顿大学人工智能创新中心主任、教授王梦迪以《大模型推理与Al for ...

腾讯网1 天

快手Kwaipilot团队全面复现DeepSeek-R1-Zero数学代码能力，训练步数仅需其1/10

4月23日，快手Kwaipilot团队发布全新大模型训练方法SRPO并宣布开源。该方法仅用 GRPO 1/10的训练成本，在数学与代码双领域基准测试中实现性能突破：AIME2024 得分50，LiveCodeBench ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果