我们大致将模型组件分为了 5 种类型。 主干网络 (Backbone): 通常是一个全卷积网络 (FCN),用来提取特征图,比如残差网络 (ResNet)。也可以是基于视觉 Transformer 的网络,比如 Swin Transformer 等。 Neck: 主干网络和任务头 (Head) 之间的连接组件,比如 FPN, ReFPN。 任务头 ...