H20Saver

项目简介

本项目旨在实现一个高效的溺水目标检测系统，基于 YOLO11x 模型进行微调。项目包含数据集分析、模型训练、评估和部署的完整流程，适用于溺水检测相关的研究和实际应用。

模型检测效果

以下是模型在验证集上的检测效果展示：

图中展示了模型对验证集图像的预测结果，包括对“溺水”、“游泳”和“离开水域”类别的检测。模型能够准确识别并定位目标，体现了良好的检测性能。

文件结构

H20Saver/
├── LICENSE
├── requirements.txt
├── results
│   ├── data_analysis.out
│   │   ├── bbox_analysis.png
│   │   ├── bbox_boxplot.png
│   │   ├── bbox_heatmap.png
│   │   ├── class_distribution.png
│   │   ├── class_distribution_pie.png
│   │   ├── class_imbalance.png
│   │   └── data_quality_report.txt
│   └── training
│       ├── F1_curve.png
│       ├── PR_curve.png
│       ├── P_curve.png
│       ├── R_curve.png
│       ├── args.yaml
│       ├── confusion_matrix.png
│       ├── confusion_matrix_normalized.png
│       ├── evaluation_values.txt
│       ├── labels.jpg
│       ├── labels_correlogram.jpg
│       ├── results.png
│       ├── train_batch0.jpg
│       ├── train_batch1.jpg
│       ├── train_batch2.jpg
│       ├── train_batch46260.jpg
│       ├── train_batch46261.jpg
│       ├── train_batch46262.jpg
│       ├── training_logs.csv
│       ├── val_batch0_labels.jpg
│       ├── val_batch0_pred.jpg
│       ├── val_batch1_labels.jpg
│       ├── val_batch1_pred.jpg
│       ├── val_batch2_labels.jpg
│       └── val_batch2_pred.jpg
├── setup.py
└── src
    ├── data_analysis.py
    ├── model_evaluation.py
    └── train.py

数据集概述

数据集统计

总图像数量：14111
有效标注图像：14111
缺失标注文件：0 (0.0%)
损坏/不可读图像：0 (0.0%)
无效标注行数：0

数据集整体质量较高，所有图像均有效且标注完整，无缺失或损坏情况。

类别分布

Drowning：41.4%
Swimming：38.1%
Out of Water：20.5%

类别分布存在一定的不均衡，可能需要在模型训练时进行数据增强或采样策略调整。

样本数量

Drowning：约 12000 样本
Swimming：约 10000 样本
Out of Water：约 5500 样本

"Out of Water" 类别的样本数量较少，可能影响模型对该类别的识别性能。

标注框尺寸分析

宽度和高度主要集中在 0.2 到 0.6 的归一化范围内。
标注框中心点分布较为均匀，无明显偏移。
宽度和高度的中位数均接近 0.4，分布较为集中。
存在少量异常值，可能为标注误差或特殊场景。

模型训练

训练配置

数据参数：
- 数据集路径：dataset/data.yaml
- 图像尺寸：640
- 批量大小：23
- 训练轮数：100
数据增强：
- HSV 调整、平移、缩放、翻转、Mosaic 和 Mixup 等。
优化参数：
- 初始学习率：0.001
- 最终学习率：0.01
- 动量：0.937
- 权重衰减：0.0005
类别平衡：
- 自动计算类别权重
- 启用焦点损失
模型参数：
- 预训练模型：yolo11x.pt
- 冻结层：backbone 和 head
- 多尺度训练

训练过程

训练过程中，模型的损失函数和评估指标如下：

训练损失：
- train/box_loss：边界框回归损失
- train/cls_loss：分类损失
- train/dfl_loss：分布式焦点损失
验证损失：
- val/box_loss：边界框回归损失
- val/cls_loss：分类损失
- val/dfl_loss：分布式焦点损失
评估指标：
- metrics/precision(B)：精确率
- metrics/recall(B)：召回率
- metrics/mAP50(B)：平均精度（IoU=0.5）
- metrics/mAP50-95(B)：平均精度（IoU=0.5:0.95）

训练结果

最终模型：
- best.pt：最佳模型权重
- last.pt：最新模型权重
评估结果：
- evaluation_values.txt：包含 mAP、精确率、召回率等指标

模型评估

F1-Confidence 曲线

F1-Confidence 曲线展示了不同置信度阈值下的 F1 分数变化。drowning 类别的 F1 分数在高置信度下表现最佳。

Recall-Confidence 曲线

Recall-Confidence 曲线展示了不同置信度阈值下的召回率变化。drowning 类别的召回率在低置信度下表现较高。

Precision-Recall 曲线

Precision-Recall 曲线展示了不同召回率下的精确率变化。drowning 类别的精确率在高召回率下表现最佳。

Precision-Confidence 曲线

Precision-Confidence 曲线展示了不同置信度阈值下的精确率变化。drowning 类别的精确率在高置信度下表现最佳。

评估指标说明

以下是模型在验证集上的评估结果：

Class	Images	Instances	Box(P)	Box(R)	mAP50	mAP50-95
all	1503	2998	0.843	0.729	0.766	0.493
drowning	1113	1406	0.874	0.876	0.924	0.634
out of water	119	351	0.838	0.464	0.537	0.324
swimming	577	1241	0.817	0.845	0.838	0.522

Images：验证集中的图像数量。
Instances：验证集中的目标实例数量。
Box(P)：边界框的精确率（Precision）。
Box(R)：边界框的召回率（Recall）。
mAP50：平均精度（Mean Average Precision）在 IoU=0.5 时的值。
mAP50-95：平均精度在 IoU=0.5 到 0.95 时的值。

评估结果分析

总体表现：
- 模型在验证集上的总体表现良好，mAP50 为 0.766，mAP50-95 为 0.493。
- 边界框的精确率（P）为 0.843，召回率（R）为 0.729，表明模型在检测目标时具有较高的准确性和召回能力。
类别表现：
- Drowning：
  - 精确率（P）：0.874
  - 召回率（R）：0.876
  - mAP50：0.924
  - mAP50-95：0.634
  - 分析：模型在“溺水”类别上的表现非常出色，精确率和召回率均较高，表明模型能够准确识别和定位溺水目标。
- Out of Water：
  - 精确率（P）：0.838
  - 召回率（R）：0.464
  - mAP50：0.537
  - mAP50-95：0.324
  - 分析：模型在“离开水域”类别上的召回率较低，可能由于该类别的样本数量较少，导致模型对该类别的识别能力较弱。
- Swimming：
  - 精确率（P）：0.817
  - 召回率（R）：0.845
  - mAP50：0.838
  - mAP50-95：0.522
  - 分析：模型在“游泳”类别上的表现良好，精确率和召回率均较高，表明模型能够准确识别和定位游泳目标。

验证结果

总体验证结果：
- mAP@0.5：0.77
- mAP@0.5:0.95：0.49

这些结果表明模型在不同 IoU 阈值下的平均精度表现良好，特别是在 IoU=0.5 时的 mAP 较高，说明模型在检测目标时具有较高的准确性。

训练日志

training_logs.csv 文件记录了每个训练轮次的详细信息，包括时间、损失值、学习率等。

模型部署

导出模型

训练完成后，模型可以导出为 ONNX 格式，便于在不同平台上部署：

model.export(format='onnx', imgsz=config.img_size)

验证结果

metrics = model.val()
print(f"验证结果: mAP@0.5={metrics.box.map:.2f}, mAP@0.5:0.95={metrics.box.map50:.2f}")

改进建议

数据增强：针对 "Out of Water" 类别样本较少的问题，可以采用数据增强技术（如旋转、缩放、镜像等）或过采样方法来平衡类别分布。
标注框尺寸优化：对于标注框尺寸异常值，建议检查标注质量，修正可能的标注误差。
模型训练策略：在模型训练时，建议采用加权损失函数或焦点损失来缓解类别不均衡问题。针对标注框尺寸分布，可设计多尺度检测模型，提升对小目标和大目标的检测性能。

依赖安装

安装项目所需的依赖库：

pip install -r requirements.txt

模型权重文件

模型权重文件下载:

git clone https://huggingface.co/EsonH/best.pt

联系方式

如有任何问题或建议，请联系作者：Eason Huang (easonhuangjz@outlook.com)

Name		Name	Last commit message	Last commit date
Latest commit History 9 Commits
results		results
src		src
.gitattributes		.gitattributes
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
requirements.txt		requirements.txt
setup.py		setup.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

H20Saver

项目简介

模型检测效果

文件结构

数据集概述

数据集统计

类别分布

样本数量

标注框尺寸分析

模型训练

训练配置

训练过程

训练结果

模型评估

F1-Confidence 曲线

Recall-Confidence 曲线

Precision-Recall 曲线

Precision-Confidence 曲线

评估指标说明

评估结果分析

验证结果

训练日志

模型部署

导出模型

验证结果

改进建议

依赖安装

模型权重文件

联系方式

About

Releases

Packages

Languages

License

esonhjz/H20Saver

Folders and files

Latest commit

History

Repository files navigation

H20Saver

项目简介

模型检测效果

文件结构

数据集概述

数据集统计

类别分布

样本数量

标注框尺寸分析

模型训练

训练配置

训练过程

训练结果

模型评估

F1-Confidence 曲线

Recall-Confidence 曲线

Precision-Recall 曲线

Precision-Confidence 曲线

评估指标说明

评估结果分析

验证结果

训练日志

模型部署

导出模型

验证结果

改进建议

依赖安装

模型权重文件

联系方式

About

Topics

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages