资讯

即使是最强的GPT-4o-Image,在复杂视觉编辑任务中的准确率也仅为28.9%,最强的开源模型BAGEL仅能完成5.8%的任务,其它被测开源模型完成率几乎为零,显示出当前开源模型与闭源模型在视觉理解能力上的差距。
上海人工智能实验室 联合多所高校发布了全新的图像编辑评估基准 RISEBench ,直指当前多模态模型在复杂图像编辑任务上的短板。这项研究引发了业界对 AI视觉理解能力 的新一轮关注,尤其是在 GPT-4o-Image 这样的领先模型也仅能完成 28 ...
RISEBench的测试结果令人震惊。即使是目前性能领先的 GPT-4o-Image ...
SridBench作为首个专门评估科研插图绘制能力的基准测试,不仅提供了宝贵的数据资源,也建立了多维度的评估协议,为未来的研究提供了系统比较的基础。随着AI技术的不断发展,我们有理由相信,未来的图像生成模型将能更好地理解科学文本,生成更准确、更专业的 ...
IT之家 11 月 8 日消息,科技媒体 MacRumors 昨日(11 月 7 日)发布博文,报道称在 iOS 18.2 更新中,图片生成 AI 工具 Image Playground 并未带来今年 6 月承诺 ...