pip install -r requirements.txt
- 目标检测:b1, b2, b3, b5(yolov3):共计约2h(1050Max-q, 16G)
- 目标检测:b4(keypoints-Mask-R-CNN):约4h(1080Ti*1, 64G)
- 基于检测结果输出跟踪提交结果:共计约5h(1080Ti*1, 64G)
- 结合单目标跟踪算法及行人重识别算法,实现有效的多目标跟踪框架;
- 视频检测结果由YOLOv3及Keypoints Mask-R-CNN提供;
- 应用SiamsRPN跟踪算法,确保对单个行人目标在非特殊场景下(无遮挡、剧烈变形等)的稳定跟踪;
- 针对困难场景(遮挡、形变),使用ReID算法进行数据关联;
详情见YOLOv3、keypoints-Mask-R-CNN、SiamsRPN等参考文献内容。
本次比赛用到的数据集主要有两类,行人检测数据集citypersons(包含网上搜索自标注的50张图片)和行人重识别的cuhk数据集
将下载的文件夹放入相应的文件夹中,如citypersons连接中包含images的压缩包,可替代仓库中的data中的citypersons中的images文件夹,cuhk-np直接放入data中
预训练权重保存在weights目录下
python3 detector/yolov3/train.py --multi-scale
ReID 部分我们使用了cuhk数据集,这个数据集有两个部分cuhk-labelled and cuhk-detected, 最后使用了cuhk-labelled的训练结果
python pysot/ReID/main.py -d cuhk -b 20 -j 4 --epochs 100 --log ./logs/cuhk_labeled/ --step-size 40 --data-dir data/cuhk03-np/labeled
python pysot/ReID/main.py -d cuhk -b 20 -j 4 --epochs 100 --log ./logs/cuhk_detected/ --step-size 40 --data-dir data/cuhk03-np/detected
本次比赛中,检测算法使用了YOLOv3和keypoints-Mask-R-CNN两种方法。
其中,YOLOv3在COCO预训练的基础上进行了重新训练,keypoints-Mask-R-CNN直接使用了作者提供的预训练模型。
为了增强黑夜检测效果的性能,b4采用keypoints-Mask-R-CNN,其他视频检测应用YOLOv3。
initialize.sh
test.sh
运行initialize.sh和test.sh后,提交结果保存至"./result/track"
由于最后提交日时间问题,b3提交结果为level_1阶段应用提交的ECO跟踪算法。复赛的前几次结果也是应用ECO算法提交,即b3与9.12日提交结果一致。
[1] https://github.com/STVIR/pysot
[2] Bo Li, Junjie Yan, Wei Wu, Zheng Zhu, Xiaolin Hu; The IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2018, pp. 8971-8980
[3] Zhu, J., Yang, H., Liu, N., Kim, M., Zhang, W., Yang, M.: Online Multi-Object Tracking with Dual Matching Attention Networks. In: ECCV (2018)
[4] Redmon J , Farhadi A . YOLOv3: An Incremental Improvement. 2018.
[5] Wang H , Fan Y , Wang Z , et al. Parameter-Free Spatial Attention Network for Person Re-Identification[J]. 2018.
[6] https://github.com/chrispolo/Keypoints-of-humanpose-with-Mask-R-CNN
[7] https://github.com/ultralytics/yolov3
[8] Zhang, Shanshan, Rodrigo Benenson, and Bernt Schiele. "Citypersons: A diverse dataset for pedestrian detection." Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 2017.