基于RepPoints的不规则文本检测器TF实现

Introduction

该代码复现主基于TensorPack, 网络构建使用TF1的操作完成。整个代码结构参考FastRCNN/MaskRCNN，具有一定的拓展能力，后续可添加其他检测和识别方法，对代码进行整合。

核心代码

deformable conv 节点代码 layers/dcn, 具体编译所依赖的环境见layers/dcn/README.md
模型代码 modeling/reppoint_detector.py
数据加载和处理代码 dataset/text.py, data.py
评测脚本在dataset/eval_tools之中，采用多边形方式描述, 对多种指标进行统计

实现细节

改代码基于TensorPack实现，训练逻辑、分布式训练等由TensorPack来处理。复现的部分主要为数据加载、模型定义、训练过程中target生成loss计算、以及后处理部分。
RepPoints可以看做1.5阶段的算法，第一次回归的GT由于是固定的，在数据加载data.py中生成，避免在Graph处理，第二次回归的target和分类的label由于跟第一阶段预测结果有关，故在训练Graph中处理。
后处理通过tf的操作实现，因此Inference Graph可直接输出label和polygon。

使用

训练框架TF,tensorpack，具体依赖见requirements.txt。由于DCN编译链接的是TF1.14，使用其他版本会出问题。
预训练模型 models 下载。
模型训练 sh train.sh. 目前将配置参数放在config.py中，也可将自定义参数保存在-.yaml文件之中，亦可在代码启动时指定参数。
模型推理 sh eval.sh. 具体参数可更改。--output-pb 'xxx.pb' 增加该参数，即可对模型进行导出为pb文件。
模型调试数据接口调试直接使用 python data.py即可可视化数据加载结果。网络部分由于Tensorpackd的逻辑基于TF1x，因此在整体调试时只能以动态图的形式来进行，不过初始的调试到可以开启eager模式，直接运行python modeling/reppoint_detector.py（需要进行简单的修改）,这样即可动态观察输出结果，提高调试效率。
NOTES.md 对原始的FastRCNN进行介绍，部分内容是相似的，可参考。

TODO

优化

IOU计算优化，使用Rotated Box
DCN offset的监督调整，对于Rotated box 可以添加约束
FPN融合方式更改

Other

Reference Code: https://github.com/aws-samples/mask-rcnn-tensorflow
issue: tensorflow/tensorflow#32383

Name		Name	Last commit message	Last commit date
Latest commit History 47 Commits
convert_d2		convert_d2
dataset		dataset
layers		layers
modeling		modeling
utils		utils
.gitignore		.gitignore
NOTES.md		NOTES.md
README.md		README.md
common.py		common.py
config.py		config.py
data.py		data.py
eval.py		eval.py
predict.py		predict.py
requirements.txt		requirements.txt
train.py		train.py
viz.py		viz.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

基于RepPoints的不规则文本检测器TF实现

Introduction

核心代码

实现细节

使用

TODO

优化

Other

About

Uh oh!

Releases

Packages

Languages

looput/RepPoints_Text

Folders and files

Latest commit

History

Repository files navigation

基于RepPoints的不规则文本检测器TF实现

Introduction

核心代码

实现细节

使用

TODO

优化

Other

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages