资讯
3 小时
科技行者 on MSN快思与慢想:让AI学会像人一样思考的突破性研究——DualityRL团队的 ...在2025年5月发布于arXiv预印本平台的一项创新研究中,DualityRL的Stephen Chung和Wenyu Du与上海AI实验室的Jie Fu共同提出了一种全新的AI训练方法,这项研究题为"Thinker: Learning to ...
1 小时
科技行者 on MSNFinTagging: 金融信息提取与结构化的新基准测试,让大语言模型更懂 ...在2025年5月,由The Fin ...
多模态大模型的探索正在逐步取得进展,近年来产业聚焦在视觉等重点模态领域突破。理想中的“Any-to-Any”大模型,Google ...
1 小时
科技行者 on MSNR2R:使用小型-大型模型令牌路由高效导航分歧推理路径在人工智能快速发展的今天,大型语言模型(LLMs)展现出令人印象深刻的推理能力,但这些能力往往伴随着巨大的推理开销,给部署带来重大挑战。近日,来自清华大学、无限极AI和上海交通大学的研究团队发表了一篇题为《R2R: Efficiently Navigating Divergent Reasoning Paths with Small-Large Model ...
“大模型还首次打破了围棋思维‘黑盒’。”上海人工智能实验室青年科学家陈恺说。围棋是公认的复杂任务,一般来说任务越复杂,通过语料习得的可能性越低,这一突破为大模型处理复杂推理任务,进而解决科学发现等难题奠定了基础。
在人工智能研究领域,一项名为"先走后跑!通过强化学习实现大模型简洁推理"(Walk Before You Run! Concise LLM Reasoning via Reinforcement ...
10 天
科技行者 on MSN链式模型:微软打造的"俄罗斯套娃"语言模型将提高训练效率和推理 ...在2024年5月发布的研究论文中,微软研究院的宋凯涛、王晓华、谭旭等研究团队提出了一种全新的学习范式——"链式模型"(Chain-of-Model,简称CoM)。这项发表于arXiv预印本平台上的研究(arXiv:2505.11820v1)旨在解决大 ...
该工具的核心在于生成归因图(attribution graphs),其作用类似于大脑的神经网络示意图,通过可视化模型内部超节点及其连接关系,呈现LLM处理信息的路径。
在5月27日闭幕的第15届中国(深圳)国际文化产业博览交易会上,腾讯集团副总裁、腾讯研究院院长司晓以《大模型时代文化内容生产的范式革命》为题发表主旨演讲,系统阐述了大模型技术对文化内容生产、传播及产业生态的颠覆性变革。他指出,大模型已从“工具赋能”跃 ...
同时,根据Hugging Face——全球最大的AI开源社区上的数据,在Open Compass本月的多模态大模型评测榜单中,商汤日日新V6(SenseNova-V6 Pro)以80.4的总分,超越Gemini 2.5 Pro,位居第一。
【谷歌悄然推出“AI Edge Gallery”应用:可在手机本地运行 AI 模型】谷歌发布Google AI Edge Gallery应用,支持手机离线运行Hugging Face的AI模型,可生成图像、回答问题等。无需联网,直接利用手机处理器计算 ...
“大模型产品安全性检验证书”由 中国软件 评测中心和中国计算机行业协会数据安全专业委员会联合颁发,经联合检测,中兴星云大模型符合指令安全、内容安全、模型安全、网络安全和数据安全的A级安全性要求。“信息安全风险评估认证证书”是由CCRC ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果