资讯

Palisade Research认为,o3模型的行为可能是为了“规避障碍以达成目标”。该公司表示,“人工智能模型会绕过障碍以实现目标”是有道理的。然而,它推测在训练过程中,该软件可能“无意中”因解决数学问题而获得更多的奖励,而不是遵循命令。 据报道 ...
【编辑推荐】为应对传统地球系统数值模型计算成本高、精度受限等挑战,研究人员开发 Aurora 基础模型。其基于超百万小时地球物理数据训练,在空气质量、海浪等多领域预测中超越现有系统,计算成本更低,为精准高效的环境预测民主化奠定基础。 地球系统 ...
港中文 MMLab、快手可灵、清华大学等团队联合提出 Flow-GRPO,首个将在线强化学习引入 Flow Matching 模型的工作。 本文由香港中文大学与快手可灵等团队联合完成。第一作者为香港中文大学 MMLab 博士生刘杰,他的研究方向为强化学习和生成模型,曾获 ACL Outstanding ...
据昆仑万维消息,昆仑万维正式开源(17B+)Matrix-Game大模型,即Matrix-Zero世界模型中的可交互视频生成大模型。Matrix-Game是Matrix系列在交互式世界生成 ...
在模型融合训练、图像Token数量提升、ScaleUp数据集和模型大小等等方面,Nexus-Gen依然存在着大量的优化潜力,目前ModelScope团队在这些不同方向,还在进行更深入的探索。 OpenAI GPT-4o发布强大图片生成能力后,业界对大模型生图能力的探索向全模态方向倾斜 ...
为贯彻落实国家人工智能与中医药数字化发展战略,推动中医药传承创新,中国中医科学院联合中国信息通信研究院、中国科学院自动化研究所等研究机构发布了国内首部中医药大模型评测团体标准。 中医药大模型评测标准覆盖场景丰富度、能力支持度、应用 ...
使用微信扫码将网页分享到微信 AI 是否进入下半场或许还有争议,但大模型进入淘汰赛已经板上钉钉。 在 DeepSeek R1 横空出世后更是愈演愈烈 ...
IT之家5 月 6 日消息,kimi-thinking-preview 模型是月之暗面提供的具有多模态推理能力和通用推理能力的多模态思考模型,它擅长深度推理。 月之暗面今日宣布,Kimi 长思考模型 API 正式发布。 kimi-thinking-preview 模型是目前最新的 k 系列思考模型,用户可以简单地通过 ...
新华社北京5月4日电(记者张辛欣、周圆)记者近日从工业和信息化部获悉,下一步将加强通用大模型和行业大模型研发布局,加快建设工业领域高质量数据集。 工业和信息化部总工程师谢少锋说,我国已形成了覆盖基础层、框架层、模型层、应用层的完整的 ...
中国 AI 初创公司 DeepSeek 再次掀起开源 AI 领域的热潮,正式发布其最新开源模型 DeepSeek-Prover-V2-671B。这一拥有6710亿参数的超大规模语言模型,专为数学推理和问题解决设计,展现了 DeepSeek 在高效 AI 开发上的持续创新能力。根据社交媒体上的最新讨论,这一模型 ...
4月30日,小米开源其首个推理大模型Xiaomi MiMo。据介绍,模型支持消费级GPU部署,推理速度相比同规模模型提升约17%。 据介绍,MiMo-7B-RL模型在AIME 24-25与LiveCodeBench v5公开测评中,表现优于OpenAI闭源模型o1-mini及阿里Qwen开源模型QwQ-32B-Preview,参数量仅为前者的一小 ...
多模态大模型产业链是一个庞大而复杂的系统,涵盖了从硬件设施到软件开发的各个环节,主要包括基础层、模型层和应用层。其中,基础层主要包括硬件和基础软件,模型层主要是多模态大模型的种类,包括CLIP、BLIP、BLIP-2、dreamLLM、LLaMA、LLaVA、flamingo、mini-GPT4 ...