Abstract
卷积神经网络在目标检测与外观特征提取方面可谓是不可或缺的部分,但是卷积操作自身的局部感知能力在一定程度上限制了时空长期依赖关系的获取。空间部分,利用局部相关(local correlation)模块来对目标与其周围环境的 拓扑关系进行建模,提升在拥挤场景下的可区分性。对每个空间位置内容都建立稠密的关系,并利用自监督学习来约束相关量。时间部分,提出了一个可学习的相关操作,基于不同层的特征图建立帧间的匹配关系,实现时间信息的对齐与传播。最后在MOT上小刷一波,直接76.5的MOTA,起飞。