资讯
模型数量与性能的权衡:研究发现,随着集成的小模型数量增加,Avengers的整体性能也随之提升。值得注意的是,仅需3个小模型,其性能便可与GPT-4.1持平(根据簇排名自动选择)。当模型数量达到约10个时,性能趋于饱和,尤其在知识、代码和情感等任务上 ...
SVRPBench是一个模块化、开源的基准测试,用于评估现实随机动态下的车辆路径规划。通过纳入时间依赖的拥堵、概率性延误和异质客户时间窗口,这个基准测试突破了静态假设,反映了真实物流的运营不确定性。
近年来,语言模型技术迅猛发展,但像Gemini2.5Pro和GPT-4.1这样的代表性成果,却被谷歌、OpenAI等巨头掌控。与此同时,开源社区的小规模模型正面临严峻挑战。为解决这一难题,上海人工智能实验室携手东北大学、西北工业大学等机构,推出Avengers框架,探索开源小模型的协同智能路径。实验显示,Avengers框架在15个涵盖数学、代码、逻辑、知识和情感任务的数据集上,平均得分超越了GP ...
在人工智能快速发展的今天,大型语言模型(LLMs)展现出令人印象深刻的推理能力,但这些能力往往伴随着巨大的推理开销,给部署带来重大挑战。近日,来自清华大学、无限极AI和上海交通大学的研究团队发表了一篇题为《R2R: Efficiently Navigating Divergent Reasoning Paths with Small-Large Model Token Routing》的研究论文, ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果