资讯
即使是最强的GPT-4o-Image,在复杂视觉编辑任务中的准确率也仅为28.9%,最强的开源模型BAGEL仅能完成5.8%的任务,其它被测开源模型完成率几乎为零,显示出当前开源模型与闭源模型在视觉理解能力上的差距。
上海人工智能实验室 联合多所高校发布了全新的图像编辑评估基准 RISEBench ,直指当前多模态模型在复杂图像编辑任务上的短板。这项研究引发了业界对 AI视觉理解能力 的新一轮关注,尤其是在 GPT-4o-Image 这样的领先模型也仅能完成 28 ...
本文由 NUS ShowLab 主导完成。第一作者宋亦仁为新加坡国立大学 ShowLab@NUS 在读博士生,研究方向是视觉生成和多模态,在 CVPR、SIGGRAPH、NeurIPS 等国际顶级会议上发表多篇研究成果。共同一作刘成为 NUS 重庆研究院四年级本科生,研究方向是视觉生成。项目负责作者为该校校长青年教授寿政。不久前,GPT-4o ...
RISEBench的测试结果令人震惊。即使是目前性能领先的 GPT-4o-Image ...
格隆汇4月24日|据AIGC开放社区,在今天凌晨1点30,OpenAI正式发布全新图像模型GPT-image-1之后,微软也在Azure ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果