资讯

该模块通过整合对齐器(Aligner)和多上下文增强器(MCE),显著提升时序建模能力,在MeViS等数据集上实现J&F分数47.6的突破,为跨模态交互与动态目标分割提供新思路。 在计算机视觉领域,指代视频目标分割(Referring Video Object Segmentation, RVOS)是一项极具挑战性 ...