GitHub - wananwu/yoloair: 🔥🔥🔥YOLOv5, YOLOv6, YOLOv7, PPYOLOE, YOLOX, YOLOR, YOLOv4, YOLOv3, PPYOLO, PPYOLOv2, Transformer, Attention, TOOD and Improved-YOLOv5-YOLOv7... Support to improve backbone, neck, head, loss, IoU, NMS and other modules🚀

YOLO Air : Makes improvements easy again

YOLOAir是一个基于PyTorch的YOLO算法库。统一模型代码框架、统一应用、统一改进、易于模块组合、构建更强大的网络模型。

简体中文 | English

支持

特性🚀 • 使用🍉 • 文档📒 • 报告问题🌟 • 更新💪 • 讨论✌️
• YOLO改进方式教程及原理参考🚀•

Introduction

模型多样化: 基于不同网络模块构建不同检测网络模型。

模块组件化: 帮助用户自定义快速组合Backbone、Neck、Head，使得网络模型多样化，助力科研改进检测算法、模型改进，网络排列组合🏆。构建强大的网络模型。

统一模型代码框架、统一应用方式、统一调参、统一改进、集成多任务、易于模块组合、构建更强大的网络模型。

内置集成YOLOv5、YOLOv7、YOLOv6、YOLOX、YOLOR、Transformer、PP-YOLO、PP-YOLOv2、PP-YOLOE、PP-YOLOEPlus、Scaled_YOLOv4、YOLOv3、YOLOv4、YOLO-Face、TPH-YOLO、YOLOv5Lite、SPD-YOLO、SlimNeck-YOLO、PicoDet等模型网络结构... 集成多种检测算法和相关多任务模型使用统一模型代码框架，集成在 YOLOAir 库中，统一应用方式。便于科研者用于论文算法模型改进，模型对比，实现网络组合多样化。包含轻量化模型和精度更高的模型，根据场景合理选择，在精度和速度俩个方面取得平衡。同时该库支持解耦不同的结构和模块组件，让模块组件化，通过组合不同的模块组件，用户可以根据不同数据集或不同业务场景自行定制化构建不同检测模型。

支持集成多任务，包括目标检测、实例分割、图像分类、姿态估计、人脸检测、目标跟踪等任务

Star🌟、Fork 不迷路，同步更新。

项目地址🌟: https://github.com/iscyy/yoloair

部分改进说明教程🌟: https://github.com/iscyy/yoloair/wiki/Improved-tutorial-presentation

🌟 Beta Supported Updates

下列功能 YOLOAir-Beta版本内测已支持🔥

完成更新支持 20+ 种 Transformer系列及其变种主干网络🌟、多种MLP网络🌟 以及 大部分重参数化结构模型网络
完成更新支持 图神经网络🌟 在YOLO中的应用🌟
完成更新支持多模态🔥 在YOLO中的应用🌟
完成更新支持 30+ 种 Attention注意力机制🌟
完成更新支持 YOLOv6模型-v2.0 paper 版本🌟
完成更新支持 YOLO系列网络模型热力图可视化🌟 (GardCAM、GardCAM++等)支持YOLOv3、YOLOv3-SPP、YOLOv4、YOLOv5、YOLOR、YOLOv7、Scaled_YOLOv4、TPH-YOLO、SPD-YOLO、PP-YOLO以及自定义网络模型等模型🌟
完成更新集成 TOOD 算法🌟
集成支持 Adaptive Training Sample Selection 标签分配策略🌟
集成支持 Task Alignment Learning 标签分配策略🌟
完成更新集成 PPYOLOE 算法模型🌟
完成更新集成 PPYOLOE Plus 算法模型🌟
News:
集成支持 AutoAssign Label Assignment🌟
集成支持 Dual Weighting Label Assignment🌟
集成支持 FreeAnchor 算法🌟
集成支持多种 Head 检测头 🌟
其他各种🌟

🌟 To Do

更新支持多任务, 包括目标检测、分类、分割、姿态估计、人脸检测、目标跟踪等任务

主要特性🚀

🚀支持更多的YOLO系列算法模型改进(持续更新...)

YOLOAir 算法库汇总了多种主流YOLO系列检测模型，一套代码集成多种模型:

内置集成 YOLOv5 模型网络结构、YOLOv7 模型网络结构、 YOLOv6 模型网络结构、PP-YOLO 模型网络结构、PP-YOLOE 模型网络结构、PP-YOLOEPlus 模型网络结构、YOLOR 模型网络结构、YOLOX 模型网络结构、ScaledYOLOv4 模型网络结构、YOLOv4 模型网络结构、YOLOv3 模型网络结构、YOLO-FaceV2模型网络结构、TPH-YOLOv5模型网络结构、SPD-YOLO模型网络结构、SlimNeck-YOLO模型网络结构、YOLOv5-Lite模型网络结构、PicoDet模型网络结构等持续更新中...

🚀支持更多的网络模型组件

如表

YOLOAir Structural Module Components

Backbones	Necks	Head
CSPDarkNet系列 HorNet系列 ResNet系列 RegNet系列 ShuffleNet系列 RepLKNet系列 MobileNet系列 EfficientNet系列 ConvNext系列 Ghost系列重参数化系列 RepVGG系列 RepMLP系列 ACNet系列 RepConv系列 OREPA系列 Mobileone系列自注意力Transformer系列 MobileViT系列 BoTNet-Transfomrer CoTNet-Transfomrer Swin-Transfomrer Swin-Transfomrer(v2) CMT Transformer PvT Transformer PvT Transformer(v2) XCiT Transformer LVViT Transformer Neighborhood-Attention-Transformer 其他 20种+ transformer系列	PANet RepPAN BiFPN CSPPAN SlimNeck ELANPAN GSNeck	YOLOv4Head YOLOv5Head YOLOv6 Efficient decoupled head YOLOv7 IDetect Head YOLOv7 IAuxDetect Head PPYOLOE Efficient Task-aligned head with DFL and VFL YOLOX DetectX Head TOODHead 自适应空间特征融合检测头ASFF Head YOLOR 隐式学习 Head EH-Head Dual Weighting Head FCOS Head Dynamic Head ...

YOLOAir Module Components

Attention注意力机制	标签分配策略	IoU损失函数
Self Attention Contextual Transformer Bottleneck Transformer S2-MLP Attention AxialAttention DANet DoubleAttention GlobalContextBlock ParNetAttention PolarizedSelfAttention SpatialGroupEnhance copy TripletAttention SK Attention CBAM Attention SE Attention Coordinate attention NAM Attention GAM Attention ECA Attention Shuffle Attention CrissCrossAttention SOCAttention SimAM Attention CrissCrossAttention CrissCrossAttention	Multi Anchor策略 YOLOv5 标签分配策略 SimOTA 标签分配策略 YOLOv7 标签分配策略 Adaptive Training Sample Selection 标签分配策略 FreeAnchor 标签分配策略 AutoAssign 标签分配策略 Task Alignment Learning 标签分配策略 Dual Weighting 标签分配策略 Probabilistic Anchor Assignment 锚分配策略其他改进的标签分配策略	CIoU DIoU GIoU EIoU SIoU alpha IOU ...

Module Components

Loss	NMS	数据增强
ComputeLoss(v3) ComputeLoss(v4) ComputeLoss(v5) ComputeLoss(v6) ComputeLoss(X) ComputeLossAuxOTA(v7) ComputeLossOTA(v7) ComputeNWDLoss ComputeLoss_PP 其他Loss	NMS Merge-NMS Soft-NMS CIoU_NMS DIoU_NMS GIoU_NMS EIoU_NMS SIoU_NMS Soft-SIoUNMS Soft-CIoUNMS Soft-DIoUNMS Soft-EIoUNMS Soft-GIoUNMS SimSPPF SimSPPF SimSPPF	Mosaic Copy paste Random affine(Rotation, Scale, Translation and Shear) MixUp HSV Random horizontal flip ...

YOLOAir Module Components

空间金字塔池化结构	模块化组件	AnchorBased / AnchorFree
SPP SPPF ASPP RFB SPPCSPC SPPFCSPC SimSPPF	Conv, GhostConv, Bottleneck, GhostBottleneck, SPP, SPPF, DWConv, MixConv2d, Focus, CrossConv,BottleneckCSP, C3, C3TR, C3SPP, C3Ghost, C3HB, C3RFEM, MultiSEAM, SEAM, C3STR, SPPCSPC, RepConv, BoT3, Air, CA, CBAM, Involution, Stem, ResCSPC, ResCSPB, ResXCSPB, ResXCSPC, BottleneckCSPB, BottleneckCSPC, ASPP, BasicRFB, SPPCSPC_group, HorBlock, CNeB,C3GC ,C3C2, nn.ConvTranspose2d, DWConvblock, RepVGGBlock, CoT3, ConvNextBlock, SPPCSP, BottleneckCSP2, DownC, BottleneckCSPF, RepVGGBlock, ReOrg, DWT, MobileOne,HorNet...	YOLOv5、YOLOv7、YOLOv3、YOLOv4、YOLOR、ScaledYOLOv4、PPYOLO、PPYOLOv2、Improved-YOLOv5、Improved-YOLOv7 YOLOX、YOLOv6 (Paper)、PPYOLOE、PPYOLOE+ ...

🚀支持更多Backbone

CSPDarkNet系列
HorNet系列
ResNet系列
RegNet 系列
ShuffleNet系列
Ghost系列
MobileNet系列
EfficientNet系列
ConvNext系列
RepLKNet系列
重参数化系列
RepVGG系列
RepMLP系列
ACNet系列
RepConv系列
OREPA系列
Mobileone系列
自注意力Transformer系列
MobileViT系列
BoTNet-Transfomrer
CoTNet-Transfomrer
Swin-Transfomrer
Swin-Transfomrer(v2)
以及其他trans系列持续更新中🎈🚀🚀🚀 注: (YOLOAir(Beta)🔥 已经完成更新 20+ 种Transformer系列主干网络、多种MLP网络以及绝大部分重参数化结构模型网络)

🚀支持更多Neck

FPN
PANet
RepPAN
BiFPN
CSPPAN
SlimNeck
ELANPAN
持续更新中🎈

🚀支持更多检测头Head

YOLOv4、YOLOv5 Head检测头;
YOLOR 隐式学习Head检测头;
YOLOX的解耦合检测头Decoupled Head、DetectX Head;
自适应空间特征融合检测头ASFF Head;
YOLOv6-v2.0 Efficient decoupled head;
YOLOv7检测头IAuxDetect Head, IDetect Head等;
PPYOLOE Efficient Task-aligned head with DFL and VFL
其他不同检测头

🚀支持更多即插即用的注意力机制Attention

在网络任何部分即插即用式使用注意力机制
Self Attention
Contextual Transformer
Bottleneck Transformer
S2-MLP Attention
SK Attention
CBAM Attention
SE Attention
Coordinate attention
NAM Attention
GAM Attention
ECA Attention
Shuffle Attention
CrissCrossAttention
Coordinate attention
SOCAttention
SimAM Attention 持续更新中🎈
🔥🔥🔥 重磅！！！作为开源项目补充，推荐一个注意力算法代码库External-Attention，里面汇总整理很全面，包含各种Attention等代码，代码简洁易读，一行代码实现Attention机制。

🚀更多空间金字塔池化结构

SPP
SPPF
ASPP
RFB
SPPCSPC
SPPFCSPC
SimSPPF 持续更新中🎈

🚀支持更多Loss

ComputeLoss
ComputeLoss(v5)
ComputeLoss(v6)
ComputeLoss(X)
ComputeLossAuxOTA(v7)
ComputeLossOTA(v7)
ComputeNWDLoss
其他Loss

🚀支持 Anchor-base 和 Anchor-Free

🌟 YOLOv5、YOLOv7、YOLOv3、YOLOv4、YOLOR、ScaledYOLOv4、PPYOLO、PPYOLOv2、Improved-YOLOv5、Improved-YOLOv7
🌟 YOLOX、YOLOv6 (Paper)、PPYOLOE、PPYOLOE+

🚀支持多种标签分配策略

Multi Anchor策略
YOLOv5 标签分配策略
SimOTA 标签分配策略
YOLOv7 标签分配策略
Adaptive Training Sample Selection 标签分配策略
Task Alignment Learning 标签分配策略
AutoAssign 标签分配策略🌟
Dual Weighting 标签分配策略🌟
FreeAnchor 标签分配策略🌟
其他改进的标签分配策略持续更新中🎈

🚀支持加权框融合(WBF)

🚀 内置多种网络模型模块化组件
Conv, GhostConv, Bottleneck, GhostBottleneck, SPP, SPPF, DWConv, MixConv2d, Focus, CrossConv,BottleneckCSP, C3, C3TR, C3SPP, C3Ghost, C3HB, C3RFEM, MultiSEAM, SEAM, C3STR, SPPCSPC, RepConv, BoT3, Air, CA, CBAM, Involution, Stem, ResCSPC, ResCSPB, ResXCSPB, ResXCSPC, BottleneckCSPB, BottleneckCSPC, ASPP, BasicRFB, SPPCSPC_group, HorBlock, CNeB,C3GC ,C3C2, nn.ConvTranspose2d, DWConvblock, RepVGGBlock, CoT3, ConvNextBlock, SPPCSP, BottleneckCSP2, DownC, BottleneckCSPF, RepVGGBlock, ReOrg, DWT, MobileOne,HorNet...等详细代码 ./models/common.py文件 内

🚀支持更多IoU损失函数

CIoU
DIoU
GIoU
EIoU
SIoU
alpha IOU
持续更新中🎈

🚀支持更多NMS

NMS
Merge-NMS
Soft-NMS
CIoU_NMS
DIoU_NMS
GIoU_NMS
EIoU_NMS
SIoU_NMS
Soft-SIoUNMS、Soft-CIoUNMS、Soft-DIoUNMS、Soft-EIoUNMS、Soft-GIoUNMS等;
持续更新中🎈

🚀支持更多数据增强

Mosaic、Copy paste、Random affine(Rotation, Scale, Translation and Shear)、MixUp、Augment HSV(Hue, Saturation, Value、Random horizontal flip

🚀支持加载YOLOv3、YOLOv4、YOLOv5、YOLOv7、YOLOR、Scaled_YOLO等网络的官方预训练权重进行迁移学习

🚀 YOLO系列网络模型热力图可视化(GardCAM、GardCAM++等) 支持YOLOv3、、YOLOv3-SPP、YOLOv4、YOLOv5、YOLOR、YOLOv7Scaled_YOLOv4、TPH-YOLO、SPD-YOLO以及自定义网络模型等模型 (YOLOAir(Beta版本内测)🔥已支持)

🚀主流网络模型结构图汇总: 模型🔗

以上组件模块使用统一模型代码框架、统一任务形式、统一应用方式，模块组件化🚀 可以帮助用户自定义快速组合Backbone、Neck、Head，使得网络模型多样化，助力科研改进检测算法，构建更强大的网络模型。

说明: 以上主要特性支持包括 Main版本和 Beta版本，部分特性暂时只完成更新在 Beta 中，不是所有更新都直接在 Main 中，后续 Beta 版本内测之后逐渐加入到 Main版本中。

内置网络模型配置支持✨

🚀包括基于 YOLOv5、YOLOv7、YOLOX、YOLOR、YOLOv3、YOLOv4、Scaled_YOLOv4、PPYOLO、PPYOLOE、PPYOLOEPlus、Transformer、YOLO-FaceV2、PicoDet、YOLOv5-Lite、TPH-YOLOv5、SPD-YOLO等其他多种改进网络结构等算法模型的模型配置文件

效果预览🚀

目标检测	目标分割

图像分类	实例分割

目标分割	目标跟踪

姿态估计	人脸检测

热力图01	热力图02

预训练权重🚀

YOLOv5 https://github.com/ultralytics/yolov5/releases/tag/v6.1
YOLOv4 https://github.com/iscyy/yoloair/releases/tag/v1.0
YOLOv3 https://github.com/iscyy/yoloair/releases/tag/v1.0
YOLOR https://github.com/iscyy/yoloair/releases/tag/v1.0
Scaled_YOLO https://github.com/iscyy/yoloair/releases/tag/v1.0
YOLOv7 https://github.com/iscyy/yoloair/releases/tag/v1.0

使用🍉

About the code. Follow the design principle of YOLOv5.
The original version was created based on YOLOv5(v6.1)

安装

在Python>=3.7.0 的环境中克隆版本仓并安装 requirements.txt，包括PyTorch>=1.7。

$ git clone https://github.com/iscyy/yoloair.git  # 克隆
$ cd YOLOAir
$ pip install -r requirements.txt  # 安装

训练

$ python train.py --data coco128.yaml --cfg configs/yolov5/yolov5s.yaml #默认为yolo

推理

detect.py 在各种数据源上运行推理, 并将检测结果保存到 runs/detect 目录。

$ python detect.py --source 0  # 网络摄像头
                          img.jpg  # 图像
                          vid.mp4  # 视频
                          path/  # 文件夹
                          path/*.jpg  # glob

融合

如果您使用不同模型来推理数据集，则可以使用 wbf.py文件通过加权框融合来集成结果。您只需要在 wbf.py文件中设置 img 路径和 txt 路径。

$ python wbf.py

论文分享

FightingCV公众号每天分享前沿论文动态
(公众号回复加群,添加小助手加交流群)

Performance

Model	size ^(pixels)	mAP^val 0.5:0.95	mAP^val 0.5	Speed ^{CPU b1 (ms)}	Speed ^{V100 b1 (ms)}	Speed ^{V100 b32 (ms)}	params ^(M)	FLOPs ^{@640 (B)}	Weights
YOLOv5n	640	28.0	45.7	45	6.3	0.6	1.9	4.5	YOLOv5n
YOLOv5s	640	37.4	56.8	98	6.4	0.9	7.2	16.5	YOLOv5s
YOLOv5m	640	45.4	64.1	224	8.2	1.7	21.2	49.0	YOLOv5m
YOLOv5l	640	49.0	67.3	430	10.1	2.7	46.5	109.1	YOLOv5l
YOLOv5x	640	50.7	68.9	766	12.1	4.8	86.7	205.7	YOLOv5x

YOLOv5n6	1280	36.0	54.4	153	8.1	2.1	3.2	4.6	YOLOv5n6
YOLOv5s6	1280	44.8	63.7	385	8.2	3.6	12.6	16.8	YOLOv5s6
YOLOv5m6	1280	51.3	69.3	887	11.1	6.8	35.7	50.0	YOLOv5m6
YOLOv5l6	1280	53.7	71.3	1784	15.8	10.5	76.8	111.4	YOLOv5l6
YOLOv5x6 + TTA	1280 1536	55.0 55.8	72.7 72.7	3136 -	26.2 -	19.4 -	140.7 -	209.8 -	YOLOv5x6

Expand

The original version was created based on YOLOv5(6.1)

Model	size ^(pixels)	mAP^val 0.5:0.95	mAP^val 0.5	deconv kernel size	Speed ^{V100 b1 (ms)}	Speed ^{V100 b32 (ms)}	params ^(M)	FLOPs ^{@640 (B)}
YOLOv5s	640	33.7	52.9	-	5.6	2.2	7.23	16.5
YOLOv5s-deconv-exp1	640	33.4	52.5	2	5.6	2.4	7.55	18.2
YOLOv5s-deconv-exp2	640	34.7	54.2	4	5.8	2.5	8.54	23.2

Expand

The training process depends on 4xV100 GPU

# train
python -m torch.distributed.run --nproc_per_node 4 train.py --device 0,1,2,3 --data data/coco.yaml --hyp data/hyps/hyp.scratch-low.yaml  --cfg path/to/model.yaml --batch 512 --epochs 300 --weights ''
# val
python val.py --verbose --data data/coco.yaml --conf 0.001 --iou 0.65 --batch 1 --weights path/to/model.pt

There is a gap between the mAP of YOLOv5s and the official one, here is just for comparison

Model	size ^(pixels)	mAP^val 0.5:0.95	mAP^val 0.5	params ^(M)	FLOPs ^{@640 (B)}
YOLOv5s	640	37.4	56.6	7.226	16.5
YOLOv5s-deconv	640	37.8	57.1	7.232	16.5

Expand

tested the 4x4 depthwise-separable deconv by setting the groups as input_channel
their params number and FLOPS are nearly the same while the new model's mAP is about 0.4 higher than the origin.

Model	size ^(pixels)	mAP^val 0.5:0.95	mAP^val 0.5	params ^(M)	FLOPs ^{@640 (B)}
YOLOv5s	640	37.2	56.0	7.2	16.5
YOLOv5s-C3GC-backbone	640	37.7	57.3	7.5	16.8

Expand

The original version was created based on YOLOv5-6.0

YOLO网络模型具体改进方式教程及原理参考

YOLOv5教程✨

与YOLOv5框架同步

未来增强✨

后续会持续建设和完善 YOLOAir 生态
完善集成更多 YOLO 系列模型，持续结合不同模块，构建更多不同网络模型
横向拓展和引入关联技术等等

Citation✨

@article{2022yoloair,
  title={{YOLOAir}: Makes improvements easy again},
  author={iscyy},
  repo={github https://github.com/iscyy/yoloair},
  year={2022}
}

Statement

Expand

The content of this site is only for sharing notes. If some content is infringing, please sending email.
If you have any question, please discuss with me by sending email.

Acknowledgements

Expand

Name		Name	Last commit message	Last commit date
Latest commit History 130 Commits
.github/ISSUE_TEMPLATE		.github/ISSUE_TEMPLATE
configs		configs
data		data
docs		docs
models		models
tools		tools
utils		utils
.DS_Store		.DS_Store
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
README_EN.md		README_EN.md
detect.py		detect.py
requirements.txt		requirements.txt
train.py		train.py
val.py		val.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

YOLO Air : Makes improvements easy again

支持

Introduction

🌟 Beta Supported Updates

🌟 To Do

主要特性🚀

内置网络模型配置支持✨

效果预览🚀

预训练权重🚀

使用🍉

安装

训练

推理

融合

论文分享

Performance

YOLO网络模型具体改进方式教程及原理参考

YOLOv5教程✨

未来增强✨

Citation✨

Statement

Acknowledgements

About

Releases

Packages

Languages

License

wananwu/yoloair

Folders and files

Latest commit

History

Repository files navigation

YOLO Air : Makes improvements easy again

支持

Introduction

🌟 Beta Supported Updates

🌟 To Do

主要特性🚀

内置网络模型配置支持✨

效果预览🚀

预训练权重🚀

使用🍉

安装

训练

推理

融合

论文分享

Performance

YOLO网络模型具体改进方式教程及原理参考

YOLOv5教程✨

未来增强✨

Citation✨

Statement

Acknowledgements

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages