Judg - 搜索 News

资讯

11 小时

BJP MP Abhijit Gangopadhyay to be airlifted to Delhi for treatment

Kolkata, June 19 (UNI) BJP MP and former Calcutta High Court judge Abhijit Gangopadhyay was urgently taken to Dum Dum Airport to be airlifted to AIIMS, New Delhi, amid growing concerns over his critic ...

16 小时

斯坦福等机构发布研究：大语言模型在不等式证明中的推理能力不足

近期，斯坦福大学、加州大学伯克利分校以及麻省理工学院等顶尖科研机构联合发布了一项关于大语言模型（LLMs）在奥数级不等式证明任务中能力的研究论文《Solving Inequality Proofs with Large Language Models ...

16 小时

AI哪怕答案正确，逻辑链却惨不忍睹，奥数级不等式证明成功率不到50 ...

斯坦福大学、UC伯克利、MIT等机构联合发布研究论文《Solving Inequality Proofs with Large Language Models》，首次系统评估了 29个顶级大模型在奥数级不等式证明任务上的能力。它的确是得到了正确的左边的式子小于右边的式子，但是正确的结论是通过代入特殊值a=b=c=1和a=1, b=4, c=16的方法得到的，这种方法显然是不严谨的。

16 小时

AI在数学推理中为何频频出错？斯坦福、MIT等机构揭示背后真相

近年来，人工智能的发展迅猛，尤其是大语言模型（LLM）在各个领域的应用引起了广泛关注。然而，最近由斯坦福大学、加州大学伯克利分校和麻省理工学院等机构联合发布的研究论文《Solving Inequality Proofs with Large Language Models》却揭示了一个令人震惊的现象：尽管这些模型在处理不等式证明时能给出正确答案，但其推理过程往往逻辑不严谨，甚至令人费解。

22 小时

谢赛宁团队新基准让LLM集体自闭，DeepSeek R1、Gemini 2.5 Pro都是零分

近年来，LLMs（如 GPT-4、Claude、Gemini 等）在代码生成领域取得了显著进展。它们不仅在经典编程基准（如 HumanEval）中表现出色，甚至在某些测试中超越了人类平均水平。这促使许多研究者开始宣称：LLM ...

22 小时

SC grants anticipatory bail to former Dimapur judge in bail money misappropriation case

New Delhi, June 17 (UNI) The Supreme Court has granted anticipatory bail to Inalo Zhimomi, the former principal district and sessions judge of Dimapur, Nagaland, in a case involving alleged embezzleme ...

中时新闻网1 天

MLB》洋基写下难堪纪录！连三场被完封贾吉被K爆好惨

纽约洋基打线熄火苦吞五连败，连续三场被完封为队史2016年后首见，连续29局一分未得，且过去六场比赛无法提供先发投手任何得分支援，状况相当惨烈，当家球星贾吉（Aaron Judge）5战狂吞12次三振成为眾矢之的。洋基昨 ...

腾讯网2 天

2025 MLB全明星投票进度报告请查收

截至北京时间今晨（6月17日）4点，阿隆-贾奇（Aaron Judge）以1568527票高居全联盟榜首，有望成为自2007-08赛季阿莱克斯-罗德里格斯（Alex ...

人人都是产品经理 on MSN2 天

LLM-as-a-Judge，解锁「LLM评估LLM」新世界

上一篇文章分析了AI产品经理做好评测的重要性，并以本人所在的AI+医疗场景为例，示例了评估标准的构建以及测评了相关大模型在此任务上的能力。

中时新闻网2 天

MLB》2025明星赛首波更新贾吉、大谷破百万票领先群雄

距离7月中的明星赛还剩1个月，大联盟公布首波投票更新，洋基外野手「法官」贾吉（Aaron Judge）获得156万票暂居美联榜首，道奇大谷翔平获得139万票领先国联群雄，第一阶段票选将于6月26日结束。明星赛规定，国联、美 ...

China.org.cn2 天

U.S. judge rules Trump's cuts to NIH funding illegal

WASHINGTON, June 16 (Xinhua) -- A federal judge in U.S. city of Boston ruled on Monday that the Trump's administration's decision to terminate funding for diversity-related research at the National ...

4 天

提前给我预支点！都穷的挺稳点的，你怎么这么富有？

一些您可能无法访问的结果已被隐去。

显示无法访问的结果