资讯
即使是最强的GPT-4o-Image,在复杂视觉编辑任务中的准确率也仅为28.9%,最强的开源模型BAGEL仅能完成5.8%的任务,其它被测开源模型完成率几乎为零,显示出当前开源模型与闭源模型在视觉理解能力上的差距。
上海人工智能实验室 联合多所高校发布了全新的图像编辑评估基准 RISEBench ,直指当前多模态模型在复杂图像编辑任务上的短板。这项研究引发了业界对 AI视觉理解能力 的新一轮关注,尤其是在 GPT-4o-Image 这样的领先模型也仅能完成 28 ...
在对九个领先视觉编辑模型的测试中,结果让人深思。尽管GPT-4o-Image在所有模型中表现最佳,但其完成率仅为28.9%。而最强的开源模型BAGEL的完成率仅为5.8%。这些数据清晰地表明,当前的视觉编辑模型在完成复杂指令方面仍存在相当大的欠缺。
今天(4月24日)凌晨1点30,OpenAI发布了全新图像模型GPT-image-1,已经通过API向全球开发者开放使用。 GPT-image-1与ChatGPT版本有很大不同,可以控制生成 ...
当前正在显示可能无法访问的结果。
隐藏无法访问的结果