图像 - 搜索 News

资讯

腾讯网20 分钟

乌改口：41架变成12架，卫星图像只能确认7架，迪亚吉列沃空军基地 ...

SBU负责人瓦西里·马柳克表示，包括图-95和图-22 M3轰炸机以及A-50侦察机在内的 41架飞机遭到袭击。SBU后来声称，此次行动造成了约70亿美元的损失，并导致俄罗斯三分之一的巡航导弹轰炸机瘫痪。

2 小时on MSN

字节Seed团队开源BAGEL：多模态理解与生成，图像视频文本一键搞定！

字节跳动旗下的Seed团队近期公布了一项重大技术进展，他们宣布开源了一个名为BAGEL的统一多模态理解与生成模型。这一模型能够同时处理文本、图像和视频数据，实现跨模态的信息交互与生成。

科技行者 on MSN5 小时

KAIST AI团队：如何用"链式缩放"突破图像超分辨率极限_xi-_研究_模型

近日，韩国科学技术院( KAIST) 人工智能研究团队的Bryan Sangwoo Kim、Jeongsol Kim和Jong Chul Ye共同发表了一项突破性研究，名为"Chain-of-Zoom: 通过尺度自回归和偏好对齐实现极端超分辨率"。这项研究于2025年5月27日发表在arXiv预印本平台（arXiv:2505.18600v2 [ cs.CV]），为图像超分辨率技术领域带来了革命 ...

腾讯网3 小时

LoRAShop：训练自由的多概念图像生成与编辑突破

在人工智能图像生成领域有了重大突破！弗吉尼亚理工大学的研究团队Yusuf Dalva、Hidir Yesiltepe和Pinar Yanardag在2025年5月29日发布了一项创新研究《LoRAShop: Training-Free ...

科技行者 on MSN2 天

图像渲染反馈强化学习：从ServiceNow研究团队到高质量矢量图形生成的 ...

在数字设计的世界里，可缩放矢量图形（SVG）一直是设计师的得力助手，它能创建无论放大多少倍都不失真的图像。但如何让人工智能自动生成这些SVG代码，却是一个棘手的问题。近日，来自ServiceNow研究团队、蒙特利尔理工学院和Mila人工智能研究所的研 ...

金融界汽车 on MSN1 小时

赛力斯申请图像识别相关专利，提高了控制器对图像识别的准确性

金融界2025年6月3日消息，国家知识产权局信息显示，重庆赛力斯凤凰智创科技有限公司申请一项名为“图像识别方法、装置、系统及终端设备”的专利，公开号CN120088338A，申请日期为2025年02月。

12 小时

NUS 推出 OmniConsistency：低成本实现图像风格化一致性，挑战 GPT-4o！

近日，新加坡国立大学（NUS）团队发布了一个名为 “OmniConsistency” 的创新项目，旨在以极低的成本复现 OpenAI 的 GPT-4o 模型在图像风格化上的一致性。这项技术不仅解决了当前开源社区在图像风格化和一致性之间的矛盾，还为广大开发者提供了可行的解决方案。

2 天

CVPR 2025 Highlight | 提升自回归模型样例学习能力，Few-shot图像编辑新 ...

近期扩散模型（diffusion model）的发展推动了基于文字引导的图像编辑（text-guided image ...

2 天

极低成本，复现GPT-4o图像风格化一致性！NUS推出OmniConsistency

直接上图， OmniConsistency 能很好的维持风格化前后构图、语义、细节一致，对人物面部特征的维持也有一定作用。对多人合影等复杂场景，很好的维持了人数、姿势、性别、种族、年龄，甚至还能维持图片中的英文文字正确性。

4 天

原来Veo 3早有苗头！人大联合值得买科技在CVPR 2025提出全新「图像到 ...

近日，来自中国人民大学高瓴人工智能学院与值得买科技 AI 团队在 CVPR 2025 会议上发表了一项新工作，首次提出了一种从静态图像直接生成同步音视频内容的生成框架。其核心设计 JointDiT（Joint Diffusion ...

2 天

2025年中国多模态大模型行业模型现状图像、视频、音频、3D模型等 ...

多模态大模型的探索正在逐步取得进展，近年来产业聚焦在视觉等重点模态领域突破。理想中的“Any-to-Any”大模型，Google ...

联合早报24 分钟

解题闯关升级“精灵伙伴” 游戏化教学点燃学生动力

崇正小学将数学课堂巧妙地设计成充满挑战和趣味的游戏冒险。学生通过解题“闯关”、升级专属“精灵伙伴”，在角色扮演、积分奖励与团队协作中投入学习。这套游戏化教学由学生管理部主任蔡文辉（43岁）设计，他也因此荣获本届教育部“杰出创新者奖”（Outstand ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果