资讯
【问小白导读】:Deep Research作为一类被广泛使用的AI智能体,一直缺乏统一的评估基准来量化他们的能力。今天问小白技术团队为大家带来Deep Research Bench,一个全新的评估基准用于全面评估Deep Research类智能体。
Moonshot AI公司近日正式推出其首款Agent产品——Kimi-Researcher (深度研究),并且已经开始进行小范围的灰度测试。 Kimi-Researcher采用端到端自主强化学习 (end-to-end agentic ...
利物浦大学联合华为诺亚方舟实验室和牛津大学等顶尖学府刚刚发布了一份重磅报告——这是业界首份针对"Deep Research ...
据媒体报道,月之暗面(Moonshot AI)正式推出其首款Agent产品——Kimi-Researcher(深度研究),并已启动小范围灰度测试。 该产品基于端到端自主强化学习(end-to-end agentic ...
Google is also open-sourcing Gemini CLI under the Apache 2.0 license. Free users can make 60 model requests per minute and 1,000 requests per day. According to Google, it is roughly double the average ...
2 天
极客网 on MSN月之暗面推出Kimi-Researcher,测试性能超过OpenAI Deep Research开始小范围灰度测试 ...
4 天
环球网科技 on MSNKimi首个Agent开启小范围灰度测试 性能超OpenAI、Gemini【环球网科技报道 记者 李文瑶】6月20日晚间,月之暗面Kimi对外宣布发布首个Agent产品Kimi-Researcher(深度研究),并开始小范围灰度测试。 Kimi-Researcher是基于端到端自主强化学习(end-to-end ...
根据近期社交媒体上的可靠信息,Gemini2.5Pro的Deep Think模式通过并行处理多个假设,显著提升了模型在复杂任务中的推理能力。相较于标准模式,Deep Think在数学、编程和多模态任务中的性能提升约15%,尤其在2025年美国数学奥林匹克(USAMO,49.4%)、LiveCodeBench编程测试 (80.4%)以及多模态推理测试MMMU ...
36氪获悉,月之暗面Kimi发布首个Agent产品Kimi-Researcher(深度研究),并开始小范围灰度测试。据介绍,Kimi-Researcher是基于端到端自主强化学习(end-to-end agentic RL)技术训练的新一代 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果