资讯

LLMs能当科研助手了? 北大出考题,结果显示:现有模型都不能胜任。 北京大学DS-Lab发布ScholarSearch,这是首个专门用于评估大语言模型在学术研究中复杂信息检索能力的数据集,包含223道高难度的学术检索题目及其答案。 它对具备联网搜索能力的代表性模型及纯推理模型进行了评估,结果显示,顶尖的纯推理模型,如GPT-4.1、DeepSeek-R1,在处理这些问题时准确率普遍低于9%。 具 ...
谷歌近期在AI技术领域迈出了重要一步,正式推出了Gemini CLI这一创新的命令行界面工具。该工具将AI问答和内容生成功能巧妙融入开发者的终端环境中,旨在利用先进的人工智能技术,优化开发流程,提升整体开发效率。 Gemini ...
Google también ha abierto Gemini CLI bajo la licencia Apache 2.0. Los usuarios gratuitos pueden hacer 60 solicitudes de ...
机器之心报道机器之心编辑部终端玩家最爱。一夜之间,谷歌 Gemini CLI 彻底火了。这是一款开源的、能够运行在终端的 AI 智能体,用户以自然语言命令的形式就可以直接在终端上执行。它还具备谷歌 Gemini Pro 2.5 的强大功能 —— ...
Google is also open-sourcing Gemini CLI under the Apache 2.0 license. Free users can make 60 model requests per minute and 1,000 requests per day. According to Google, it is roughly double the average ...
开始小范围灰度测试 ...
快科技6月23日消息,据媒体报道,月之暗面(Moonshot AI)正式推出其首款Agent产品——Kimi-Researcher(深度研究),并已启动小范围灰度测试。 该产品基于端到端自主强化学习(end-to-end agentic ...
【环球网科技报道 记者 李文瑶】6月20日晚间,月之暗面Kimi对外宣布发布首个Agent产品Kimi-Researcher(深度研究),并开始小范围灰度测试。 Kimi-Researcher是基于端到端自主强化学习(end-to-end ...
最近,谷歌不管是大模型,还是产品,上新的动作都有点频繁。。。昨天,他们又宣布把 Deep Research 背后调用的模型升级到了最强的 Gemini 2.5 Pro ...
据悉,Gemini的Deep Research现已升级至Gemini2.5Pro实验模型,为用户提供更强大的研究支持。 这一功能旨在通过AI驱动的深度分析,帮助用户快速整理复杂信息并生成详尽报告,进一步巩固Gemini在AI助手领域的竞争力。