mindspore-lab · HaoyangLee · Mar 8, 2023 · Mar 8, 2023
diff --git a/deploy/models_utils/conversion/onnx2om.sh b/deploy/models_utils/conversion/onnx2om.sh
@@ -1,12 +1,12 @@
 #!/bin/bash
-pushd ../deploy/mindx/pdmodel2onnx
+pushd ../deploy/models_utils/conversion/onnx_optim
 python insert_argmax.py --model_path=/xx/ch_ppocr_server_v2.0_rec_infer.onnx \
                         --check_output_onnx=True &
 pid1=$!
 wait $pid1
 popd
 
-pushd ../deploy/mindx/auto_gear
+pushd ../deploy/models_utils/conversion/auto_gear
 python auto_gear.py --image_path=/xx/lsvt/images \
                     --gt_path=/xx/lsvt/labels \
                     --det_onnx_path=ch_ppocr_server_v2.0_det_infer.onnx \

diff --git a/deploy/mx_infer/README.md b/deploy/mx_infer/README.md
@@ -15,11 +15,61 @@ MindOCR的推理工具集成了文本检测、角度分类和文字识别模块
 | mxVision | 3.0.0          |
 | Python   | 3.9            |
 
+#### 模型下载
 
+##### 所用模型下载地址
 
-#### 模型准备
+Paddle PP-OCR server 2.0模型:
 
-##### 1. paddle转onnx
+| 名称               | 下载链接              |
+| ----------------- | ---------------  |
+| Paddle PP-OCR server 2.0 DBNet      | https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_server_v2.0_det_infer.tar|
+| Paddle PP-OCR server 2.0 Cls      | https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_cls_infer.tar|
+| Paddle PP-OCR server 2.0 CRNN      | https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_server_v2.0_rec_infer.tar|
+
+
+Paddle PP-OCR 3.0模型:
+
+
+| 名称               | 下载链接              |
+| ----------------- | ---------------  |
+| Paddle PP-OCR3.0 DBNet      | https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_det_infer.tar|
+| Paddle PP-OCR3.0 Cls      | https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_cls_infer.tar|
+| Paddle PP-OCR3.0 SVTR     | https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_rec_infer.tar|
+
+
+
+识别模型字典文件下载地址：
+https://raw.githubusercontent.com/PaddlePaddle/PaddleOCR/release/2.5/ppocr/utils/ppocr_keys_v1.txt
+
+
+**注： ch_ppocr_server_v2.0 与 ch_PP-OCRv3 均使用此名为ch_ppocr_mobile_v2.0_cls_infer的分类模型与名为ppocr_keys_v1.txt的识别模型的字典。**
+
+
+##### 所用测试数据集下载地址
+数据集ICDAR-2019 LSVT下载地址：
+
+
+| 名称               | 下载链接              |
+| ----------------- | ---------------  |
+| 图片压缩包1      | https://dataset-bj.cdn.bcebos.com/lsvt/train_full_images_0.tar.gz|
+| 图片压缩包2      | https://dataset-bj.cdn.bcebos.com/lsvt/train_full_images_1.tar.gz|
+| 标注文件     | https://dataset-bj.cdn.bcebos.com/lsvt/train_full_labels.json|
+
+
+图片压缩包名为 train_full_images_0.tar.gz 与 train_full_images_1.tar.gz
+
+标签文件名为 train_full_labels.json
+
+##### 1 数据集准备
+
+数据集准备参考deploy/data_utils/preprocess目录下对应数据的标签格式化转换脚本，并按照脚本里注释的步骤依次下载数据集、新建文件夹、解压文件并执行脚本。
+
+##### 2 模型转换
+
+##### 模型准备
+
+###### 2.1 paddle转onnx
 
 将下载好的paddle模型转换成onnx模型。
 
@@ -34,63 +84,77 @@ MindOCR的推理工具集成了文本检测、角度分类和文字识别模块
 
 PP-OCR server 2.0版本指令参考如下：
 
-```
-paddle2onnx --model_dir ./ch_ppocr_server_v2.0_det_infer/ --model_filename inference.pdmodel \
-            --params_filename inference.pdiparams --save_file ./ch_ppocr_server_v2.0_det_infer.onnx \
-            --opset_version 11 --enable_onnx_checker True --input_shape_dict="{'x':[-1,3,-1,-1]}"
-```
+  ```
+  paddle2onnx --model_dir ./ch_ppocr_server_v2.0_det_infer/ --model_filename inference.pdmodel \
+              --params_filename inference.pdiparams --save_file ./ch_ppocr_server_v2.0_det_infer.onnx \
+              --opset_version 11 --enable_onnx_checker True --input_shape_dict="{'x':[-1,3,-1,-1]}"
+  ```
 
 Paddle PP-OCR3.0版本指令参考如下：
-```
-paddle2onnx --model_dir ./ch_PP-OCRv3_det_infer/ --model_filename inference.pdmodel \
-            --params_filename inference.pdiparams --save_file ./ch_PP-OCRv3_det_infer.onnx \
-            --opset_version 11 --enable_onnx_checker True
-```
+
+  ```
+  paddle2onnx --model_dir ./ch_PP-OCRv3_det_infer/ --model_filename inference.pdmodel \
+              --params_filename inference.pdiparams --save_file ./ch_PP-OCRv3_det_infer.onnx \
+              --opset_version 11 --enable_onnx_checker True
+  ```
 
 CRNN paddle模型转成onnx模型指令参考如下：
-```
-paddle2onnx --model_dir ./ch_ppocr_server_v2.0_rec_infer/ --model_filename inference.pdmodel \
-            --params_filename inference.pdiparams --save_file ./ch_ppocr_server_v2.0_rec_infer.onnx \
-            --opset_version 11 --enable_onnx_checker True --input_shape_dict="{'x':[-1,3,32,-1]}"
-```
+
+  ```
+  paddle2onnx --model_dir ./ch_ppocr_server_v2.0_rec_infer/ --model_filename inference.pdmodel \
+              --params_filename inference.pdiparams --save_file ./ch_ppocr_server_v2.0_rec_infer.onnx \
+              --opset_version 11 --enable_onnx_checker True --input_shape_dict="{'x':[-1,3,32,-1]}"
+  ```
 
 SVTR paddle模型转成onnx模型指令参考如下：
-```
-paddle2onnx --model_dir ./ch_PP-OCRv3_rec_infer/ --model_filename inference.pdmodel \
-            --params_filename inference.pdiparams --save_file ./ch_PP-OCRv3_rec_infer.onnx \
-            --opset_version 11 --enable_onnx_checker True
-```
+
+  ```
+  paddle2onnx --model_dir ./ch_PP-OCRv3_rec_infer/ --model_filename inference.pdmodel \
+              --params_filename inference.pdiparams --save_file ./ch_PP-OCRv3_rec_infer.onnx \
+              --opset_version 11 --enable_onnx_checker True
+  ```
 
 分类模型转成onnx模型指令参考如下：
-```
-paddle2onnx --model_dir ./ch_ppocr_mobile_v2.0_cls_infer --model_filename inference.pdmodel \
-            --params_filename inference.pdiparams --save_file ./ch_ppocr_mobile_v2.0_cls_infer.onnx \
-            --opset_version 11 --enable_onnx_checker True
-```
 
-##### 2. onnx转om（模型自动分档）
+  ```
+  paddle2onnx --model_dir ./ch_ppocr_mobile_v2.0_cls_infer --model_filename inference.pdmodel \
+              --params_filename inference.pdiparams --save_file ./ch_ppocr_mobile_v2.0_cls_infer.onnx \
+              --opset_version 11 --enable_onnx_checker True
+  ```
+
+###### 2.2 onnx转om（模型自动分档）
 
 将onnx模型转化为om模型。
 
-参考tools/model_converter.sh脚本执行自动串行讲onnx转om。
+参考deploy/models_utils/conversion/onnx2om.sh脚本执行自动串行执行脚本将onnx模型转om模型。
 
-```
-bash model_converter.sh
-```
+需要适配脚本对应数据和模型参数：
+
+| 参数名称          | 描述                |
+|---------------|-------------------|
+| model_path    | 需要插入argmax的模型文件路径 |
+| image_path    | 数据集图片数据路径         |
+| gt_path       | 数据集标签路径           |
+| det_onnx_path | det onnx模型路径      |
+| rec_onnx_path | rec onnx模型路径      |
+
+  ```
+  bash onnx2om.sh
+  ```
 
 针对Cls的分档
 
-分类模型没有对HW分档，只对N进行分档，不需要在数据集上统计，参考demo/data/models/cls/atc.sh执行转换。
+分类模型没有对HW分档，只对N进行分档，不需要在数据集上统计，参考deploy/models_utils/conversion/auto_gear/atc.sh执行转换。
 
-```
-bash atc.sh
-```
+  ```
+  bash atc.sh
+  ```
 
-model_converter.sh脚本包括以下步骤：
+### onnx2om.sh脚本包括以下步骤，不需要单独执行，已经集成在脚本中
 
-###### 2.1 识别模型插入ArgMax算子
+###### 识别模型插入ArgMax算子
 
-转到data/pdmodel2onnx目录下，使用算子插入工具insert_argmax，在文字识别模型（CRNN/SVTR）中插入argmax算子：
+转到deploy/models_utils/conversion/onnx_optim目录下，使用算子插入工具insert_argmax，在文字识别模型（CRNN/SVTR）中插入argmax算子：
 
   ```
    python3 insert_argmax.py --model_path /xx/xx/ch_ppocr_server_v2.0_rec_infer.onnx --check_output_onnx True
@@ -99,55 +163,55 @@ model_converter.sh脚本包括以下步骤：
 
 转换出来的结果位于'model_path'路径下，命名为'ch_ppocr_server_v2.0_rec_infer_argmax.onnx' 或 'ch_PP-OCRv3_rec_infer_argmax.onnx'的onnx模型文件。
 
-###### 2.2 onnx模型转om模型
+###### onnx模型转om模型
 
 这里实现了Shape分档功能。例如，CRNN模型的输入Shape为(N, 3, 32, W)，在模型转换时，N和W设置了多种可选的组合，即为Shape分档。
 
 模型分档时，对于如何设置HW的组合，这里提供了一些自动化脚本，可以从数据集中自动统计，实现自动分档功能。
 
-demo/data/auto_gear/auto_gear.py提供了自动分档功能，它基于数据集统计分档参数，然后自动调用ATC工具，实现模型分档与转换。auto_gear.py有很多可选参数，详情见README，本文这里只使用默认参数。
+deploy/models_utils/conversion/auto_gear/auto_gear.py提供了自动分档功能，它基于数据集统计分档参数，然后自动调用ATC工具，实现模型分档与转换。auto_gear.py有很多可选参数，详情见README，本文这里只使用默认参数。
 
-demo/data/models和demo/data/models_310目录，提供了ATC工具的例子，用户可以手动调用。
+deploy/models_utils/conversion/auto_gear目录，提供了ATC工具的例子，用户可以手动调用。
 
-###### 2.3 分档
+###### 分档
 
 （1）v2.0的DBNet/CRNN分档
 
-```
-python auto_gear.py --image_path=/xx/xx/lsvt/images --gt_path=/xx/xx/lsvt/labels --det_onnx_path=/xx/xx/ch_ppocr_server_v2.0_det_infer.onnx --rec_onnx_path=/xx/xx/ch_ppocr_server_v2.0_rec_infer_argmax.onnx --rec_model_height=32 --soc_version=Ascend310P3 --output_path=./lsvt_om_v2
-```
+  ```
+  python3 auto_gear.py --image_path=/xx/xx/lsvt/images --gt_path=/xx/xx/lsvt/labels --det_onnx_path=/xx/xx/ch_ppocr_server_v2.0_det_infer.onnx --rec_onnx_path=/xx/xx/ch_ppocr_server_v2.0_rec_infer_argmax.onnx --rec_model_height=32 --soc_version=Ascend310P3 --output_path=./lsvt_om_v2
+  ```
 
 其中，CRNN模型的H为32，所以rec_model_height设置为32。运行结束后会在output_path目录下生成crnn和dbnet文件夹，crnn下会有多个om文件，dbnet文件夹下只有1个om文件。
 
 （2）v3.0的DBNet/SVTR分档
 
-```
-python auto_gear.py --image_path=/xx/xx/lsvt/images --gt_path=/xx/xx/lsvt/labels --det_onnx_path=/xx/xx/ch_PP-OCRv3_det_infer.onnx --rec_onnx_path=/xx/xx/ch_PP-OCRv3_rec_infer_argmax.onnx --rec_model_height=48 --soc_version=Ascend310P3 --output_path=./lsvt_om_v3
-```
+  ```
+  python3 auto_gear.py --image_path=/xx/xx/lsvt/images --gt_path=/xx/xx/lsvt/labels --det_onnx_path=/xx/xx/ch_PP-OCRv3_det_infer.onnx --rec_onnx_path=/xx/xx/ch_PP-OCRv3_rec_infer_argmax.onnx --rec_model_height=48 --soc_version=Ascend310P3 --output_path=./lsvt_om_v3
+  ```
 
 其中，SVTR模型的H为48，所以rec_model_height设置为48。运行结束后会在output_path目录下生成svtr和dbnet文件夹，svtr下会有多个om文件，dbnet文件夹下只有1个om文件。
 
-###### 2.4 自动选择
+###### 自动选择
 
 SVTR和CRNN在自动分档时会产生多个模型文件，使用自动挑选工具auto_select自动挑选识别性能更优的om模型。
 
-在demo/data/auto_gear目录下，参考命令如下：
+在deploy/models_utils/conversion/auto_gear目录下，参考命令如下：
 
-```
-python3 auto_select.py --rec_model_path lsvt_om_v2/crnn
-python3 auto_select.py --rec_model_path lsvt_om_v3/svtr
-```
+  ```
+  python3 auto_select.py --rec_model_path lsvt_om_v2/crnn
+  python3 auto_select.py --rec_model_path lsvt_om_v3/svtr
+  ```
 
 完成挑选后，被选中的om文件存在rec_model_path下的selected文件夹下面，后续推理时选择该文件下的模型使用即可。
 
-#### 推理
+#### 3 推理
 
 ##### 命令示例
 
 - 检测+分类+识别全流程
 
   ```
-  mindocr_infer --input_images_dir=/xxx/images --device=Ascend310 --det_model_path=/xxx/dbnet/dbnet_dynamic_dims_100.om --cls_model_path=/xxx/cls/cls_310.om --rec_model_path=/xxx/crnn/ --rec_char_dict_path=/xxx/ppocr_keys_v1.txt
+  mindocr --input_images_dir=/xxx/images --device=Ascend310 --det_model_path=/xxx/dbnet/dbnet_dynamic_dims_100.om --cls_model_path=/xxx/cls/cls_310.om --rec_model_path=/xxx/crnn/ --rec_char_dict_path=/xxx/ppocr_keys_v1.txt
   ```
 
   结果默认保存在inference_results目录下，文件名为pipeline_results.txt
@@ -157,7 +221,7 @@ python3 auto_select.py --rec_model_path lsvt_om_v3/svtr
   不传入--cls_model_path参数，就会跳过方向分类，只执行检测+识别
 
   ```
-  mindocr_infer --input_images_dir=/xxx/images --device=Ascend310 --det_model_path=/xxx/dbnet/dbnet_dynamic_dims_100.om --rec_model_path=/xxx/crnn/ --rec_char_dict_path=/xxx/ppocr_keys_v1.txt
+  mindocr --input_images_dir=/xxx/images --device=Ascend310 --det_model_path=/xxx/dbnet/dbnet_dynamic_dims_100.om --rec_model_path=/xxx/crnn/ --rec_char_dict_path=/xxx/ppocr_keys_v1.txt
   ```
 
   结果默认保存在inference_results目录下，文件名为pipeline_results.txt
@@ -167,7 +231,7 @@ python3 auto_select.py --rec_model_path lsvt_om_v3/svtr
   可以单独运行文本检测，不传入分类和识别的参数即可
 
   ```
-  mindocr_infer --input_images_dir=/xxx/images --device=Ascend310 --det_model_path=/xxx/dbnet/dbnet_dynamic_dims_100.om
+  mindocr --input_images_dir=/xxx/images --device=Ascend310 --det_model_path=/xxx/dbnet/dbnet_dynamic_dims_100.om
   ```
 
   结果默认保存在inference_results目录下，文件名为det_results.txt
@@ -177,7 +241,7 @@ python3 auto_select.py --rec_model_path lsvt_om_v3/svtr
   可以单独运行文字识别，不传入检测和分类的参数即可
 
   ```
-  mindocr_infer --input_images_dir=/xxx/images --device=Ascend310 --det_model_path=/xxx/dbnet/dbnet_dynamic_dims_100.om --cls_model_path=/xxx/cls/cls_310.om --rec_model_path=/xxx/crnn/ --rec_char_dict_path=/xxx/ppocr_keys_v1.txt
+  mindocr --input_images_dir=/xxx/images --device=Ascend310 --det_model_path=/xxx/dbnet/dbnet_dynamic_dims_100.om --cls_model_path=/xxx/cls/cls_310.om --rec_model_path=/xxx/crnn/ --rec_char_dict_path=/xxx/ppocr_keys_v1.txt
   ```
 
   结果默认保存在inference_results目录下，文件名为rec_results.txt