资讯

在这波Agent浪潮中,产品已然形成两大阵营:专注特定领域深耕的垂直型Agent,和试图覆盖全场景的通用 Agent。这场"谁才是Agent 的终极形态"的争论或许为时尚早——底层模型能力才是产品能力的真正瓶颈:通用型难称全能,垂直型的深度也受限。
嘉宾简介: 唐业辉,华为诺亚方舟实验室高级研究员,聚焦于基础大模型的研究,主导了盘古 MoE 大模型、1.5B 端侧模型等多个基础模型的训练,相关成果已在华为终端、华为云等业务场景商用。他博士毕业于北京大学,在 NeurIPS、ICML ...
近期,山西大学智能信息处理研究所团队在图神经网络研究方面取得重要进展,相关成果“Multi-Channel Disentangled Graph Neural Networks with Different Types of ...
在接受独家采访时,人工智能安全研究机构Apart Research的创始人Esben Kran表示,他担心这次「GPT-4o舔狗」事件可能只是揭示了更深层、更具策略性的模式: Kran表示:「我们发现,有非常明确的迹象表明模型可以用这种方式进行分析,而且这么做非常有价值,因为你可以从它们对用户的反应中获得很多有效的反馈。」 ...
华中科技大学、北京邮电大学等多所高校研究团队共同推出的Perception-R1(PR1),在视觉推理中最基础的感知层面,探究rule-based RL能给模型感知pattern带来的增益。 超越YOLOv3、Faster-RCNN,首个在COCO2017 val set上突破30AP的纯多模态开源LLM来啦! 华中科技大学、北京 ...
3B模型超越Meta 7B模型,超长视频理解SOTA刷新了! 来自上海交通大学、北京智源研究院、特伦托大学的联合研究团队推出了Video-XL-Pro,实现近一万帧 ...
新华社北京5月4日电(记者张辛欣、周圆)记者近日从工业和信息化部获悉,下一步将加强通用大模型和行业大模型研发布局,加快建设工业领域高质量数据集。 工业和信息化部总工程师谢少锋说,我国已形成了覆盖基础层、框架层、模型层、应用层的完整的 ...
中国 AI 初创公司 DeepSeek 再次掀起开源 AI 领域的热潮,正式发布其最新开源模型 DeepSeek-Prover-V2-671B。这一拥有6710亿参数的超大规模语言模型,专为数学推理和问题解决设计,展现了 DeepSeek 在高效 AI 开发上的持续创新能力。根据社交媒体上的最新讨论,这一模型 ...
当下,人工智能已然成为推动各行业发展变革的核心驱动力。 AI大模型在人工智能领域表现卓越,尤其在自然语言理解与自动处理业务流程中作用 ...
多模态大模型产业链是一个庞大而复杂的系统,涵盖了从硬件设施到软件开发的各个环节,主要包括基础层、模型层和应用层。其中,基础层主要包括硬件和基础软件,模型层主要是多模态大模型的种类,包括CLIP、BLIP、BLIP-2、dreamLLM、LLaMA、LLaVA、flamingo、mini-GPT4 ...
这篇研究介绍了食品领域专用大语言模型FoodSky的创新成果。该模型通过构建大规模食品指令数据集FoodEarth,结合主题选择性 ...