Image - 搜索 News

资讯

3 天

GPT-4o-Image 图像编辑遇挑战：上海AI实验室发布新基准，深度理解成关键

上海人工智能实验室联合多所高校发布了全新的图像编辑评估基准 RISEBench ，直指当前多模态模型在复杂图像编辑任务上的短板。这项研究引发了业界对 AI视觉理解能力的新一轮关注，尤其是在 GPT-4o-Image 这样的领先模型也仅能完成 28 ...

3 天

GPT-4o-Image视觉编辑遭严峻挑战：RISEBench发布，AI理解力成关键

RISEBench的测试结果令人震惊。即使是目前性能领先的 GPT-4o-Image ...

腾讯网3 天

GPT-4o-Image仅完成28.9%任务！上海AI实验室等发布图像编辑新基准，360道 ...

即使是最强的GPT-4o-Image，在复杂视觉编辑任务中的准确率也仅为28.9%，最强的开源模型BAGEL仅能完成5.8%的任务，其它被测开源模型完成率几乎为零，显示出当前开源模型与闭源模型在视觉理解能力上的差距。

腾讯网1 小时

HLIP：密歇根大学团队打造3D医学影像高效语言-图像预训练新模型

密歇根大学研究团队提出的HLIP框架采用了全新的思路。他们没有改变原始数据或设计复杂的模型，而是利用放射学数据天然存在的层次结构来优化处理流程。这就像是在不改变图册内容的情况下，发明了一种能够同时浏览所有页面并快速定位关键信息的方法。

4 小时

气旋、干旱与洪水：澳洲六月前自然灾害损失已达22亿澳元

Local businesses cleaning up after flooding in Taree, New South Wales, Saturday, May 24, 2025. (AAP Image/Adam Oswell) NO ...

3 天

GPT-4o-Image仅完成28.9%任务！上海AI实验室等发布图像编辑基准

即使是最强的GPT-4o-Image，在复杂视觉编辑任务中的准确率也仅为 28.9% ，最强的开源模型BAGEL仅能完成 5.8% 的任务，其它被测开源模型完成率几乎为零，显示出当前开源模型与闭源模型在视觉理解能力上的差距。

威锋 on MSN16 小时

有迹象表明今年 WWDC 规模将比 2023 和 2024 年“更小”

据彭博社的马克·古尔曼 (Mark Gurman) 称，有迹象表明，今年的 WWDC 规模将比 2023 年和 2024 年“更小”。在 2023 年的 WWDC 上，苹果发布了 Vision Pro ...

十轮网科技资讯 on MSN23 小时

手机脱机使用AI模型，Google AI Edge Gallery在GitHub悄悄推出

Google日前低调推出一款实验性应用程序，将生成式AI的强大功能直接交到人们手中。名为“Google AI Edge Gallery”的Google应用程序可在手机上执行开源机器学习社交媒体平台Hugging ...

法国国际广播电台8 小时

法国研究俄罗斯非洲商贸关系

[法国国际关系研究所]（IFRI）在五天前发布了一份由法国学者撰写的，分析2022年起俄罗斯（la Russie）与撒哈拉以南非洲（l'Afrique ...

生物通3 小时

癌症临时造口患者参与国家居家医疗项目的体验：一项质性研究及其 ...

为解决癌症临时造口患者术后自我管理困难及心理社会适应问题，韩国研究人员通过质性研究探索了10例患者参与国家居家医疗试点项目的体验。研究发现患者面临日常生活调整、技能学习、过渡期医疗支持和社会适应四大挑战，揭示了居家医疗在提供持续教育、专业护理和情感支持中的关键作用，为优化国家癌症护理政策提供了实证依据。研究发表于《Supportive Care in Cancer》，强调将造口护士（ostomy ...

1 天

极低成本，复现GPT-4o图像风格化一致性！NUS推出OmniConsistency

直接上图， OmniConsistency 能很好的维持风格化前后构图、语义、细节一致，对人物面部特征的维持也有一定作用。对多人合影等复杂场景，很好的维持了人数、姿势、性别、种族、年龄，甚至还能维持图片中的英文文字正确性。

GitHub2 天

新版GPT-4o生图功能太强了（附国内使用指南）【6月最新更新】

国内能轻松使用的 GPT-4o 画图，无需翻墙，无限制使用 GPT-4o 文生图、图生图、吉卜力等功能本项目提供全面的 GPT-4o 国内使用指南，包括国内可用的 GPT-4o 中文版、GPT-4o 国内入口推荐和详细使用教程，帮助您快速使用上 GPT-4o 文生图、图生图~ 什么是 GPT-4o 中文版 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果