PaddleOCR v4模型使用Mkldnn在非AVX512 CPU上变得非常慢 #10346

sdcb · 2023-07-11T06:20:05Z

注：这个问题是#10337 的重开，它未得到解决或解答，且被关闭了，这个问题和PaddleInference 2.5准确率下降的问题是不同的问题。

系统环境/System Environment：Windows 10
Paddle： 2.5.0/2.4.2 with mkldnn
PaddleOCR： ppocr-v4 识别模型

AVX512 CPU上速度正常，速度大约是1.3s
在其它CPU上奇慢无比，速度大约是60秒~100秒
（虚拟机CPU都是4核）

使用Openblas或者Onnx速度都正常，使用ppocr-v3识别模型也正常。

magicleo · 2023-07-12T06:19:19Z

已经有V4模型了？请问模型地址在哪？

yaomichael · 2023-07-12T06:38:42Z

请问部署的时候，Flags_use_mkldnn 是保持为0（缺省值）吗？

sdcb · 2023-07-12T06:49:30Z

use_mkldnn=1

yaomichael · 2023-07-12T07:49:45Z

能试试=0的情况吗？

yaomichael · 2023-07-12T08:25:53Z

另外问个问题，use_mkldnn=1，但是pcrv3的话，速度也是正常的（1-2s）？
换句话说PCRv4和v3的差别就能导致这个性能降级？

sdcb · 2023-07-12T11:27:17Z

另外问个问题，use_mkldnn=1，但是pcrv3的话，速度也是正常的（1-2s）？换句话说PCRv4和v3的差别就能导致这个性能降级？

对的，在我另一台电脑上（CPU i9-9880h），基于v4模型，使用openblas性能很快（8秒），使用onnx性能很快（2秒），使用mkldnn性能很慢（33秒），使用gpu性能也很快（0.1秒-使用3080ti）
同时如果使用v3模型和mkldnn，性能也很快（0.5秒）
如果基于v4和mkldnn，且CPU支持AVX512F，则性能回归很快（如上面的示例，1.3s vs 95s，基于Azure 4核虚拟机测试）

sdcb · 2023-07-12T11:33:51Z

换言之，这个问题和ppocr-v4、mkldnn、AVX512F同时相关。

apple2333cream · 2023-08-03T00:44:09Z

ppocr-v4识别模型能下载了吗，请问有下载地址吗？

sdcb · 2023-08-03T08:45:18Z

@apple2333cream 未公开发布。

github-actions · 2024-01-03T02:41:22Z

This issue has been automatically marked as stale because it has not had recent activity. It will be closed in 7 days if no further activity occurs. Thank you for your contributions.

sdcb · 2024-01-06T15:38:17Z

no, this issue was not fixed, please check.

jcyrss · 2024-01-11T12:32:03Z

我遇到了一样的问题，在Python解释器（3.10），PaddlePaddle（2.5.2）, PaddleOCR（2.7.0.3）版本一样的情况下，同样的一张图，都使用ch_PP-OCRv4 ，enable_mkldnn=True

在我的一个AMD 7840U（支持 AVX-512）笔记本上识别速度是 0.2秒，
而在另一个AMD 5600U（不支持 AVX-512）笔记本上识别速度是 13秒，如果改为 ch_PP-OCRv3，则为0.3秒左右

enable_mkldnn=False差别不大，都是2-3秒左右。

假定这个问题确实是由CPU是否支持AVX-512造成的，我查了一下消费级CPU， Intel 自从 2019年9月发布的 10代酷睿就支持了。 AMD则比较晚，2023年的 Zen 4 才支持。

是不是百度测试团队用的都是 Intel的CPU？

为兼容用户使用的老电脑，我退回使用ch_PP-OCRv3，但是版本3好像又有enable_mkldnn=True时，预测不准确的问题

我只能退回使用ch_PP-OCRv2，但是v2识别确实不如v4准确。

哎，感觉到处是坑。

百度做这个产品的到底有没有靠谱的测试团队啊？

我非常感谢百度免费分享这样的产品，但是不测试好就发布出来，这。。。。。

LLee233 · 2024-05-13T08:30:07Z

@sdcb Hi, 请问你在进行推理的时候是否都是用的官方推理库？我们这边check了一下，发现官方的推理库都是用带avx512的机器生成的。在这种情况下，如果在非avx512机器上用官方推理库，可能就会导致这种情况，类似#11597。针对这个issue我们已经提了PR，等merge之后应该就能解决了。

UserWangZz · 2024-05-16T02:58:38Z

该issue长时间未更新，暂将此issue关闭，如有需要可重新开启。

paddle-bot bot assigned tink2123 Jul 11, 2023

n0099 mentioned this issue Aug 4, 2023

PaddleOCR使用预测库版本2.5进行OCR识别，开启MKL加速，在AVX512指令集CPU上反而比2.4.1慢 #10372

Closed

sdcb mentioned this issue Dec 7, 2023

请问为何 Mkldnn 在 ChineseV4 下运行会比 Onnx 和 Openblas 慢很多？ sdcb/PaddleSharp#75

Closed

github-actions bot added the stale label Jan 3, 2024

github-actions bot removed the stale label Jan 24, 2024

jzhang533 added triaged this issue has been looked, and triaged. needs investigation this issue needs investigation to either narrow down, or clarify intel related labels Apr 10, 2024

aliencaocao mentioned this issue May 8, 2024

Illegal instruction when loading ppocrv4 chinese rec model on CPU #11597

Closed

jzhang533 mentioned this issue May 11, 2024

[OneDNN]Fix ocr error since pass avx512 command PaddlePaddle/Paddle#64132

Merged

UserWangZz closed this as completed May 16, 2024

paddle-bot bot added the status/close label May 16, 2024

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

PaddleOCR v4模型使用Mkldnn在非AVX512 CPU上变得非常慢 #10346

PaddleOCR v4模型使用Mkldnn在非AVX512 CPU上变得非常慢 #10346

sdcb commented Jul 11, 2023 •

edited

Loading

magicleo commented Jul 12, 2023

yaomichael commented Jul 12, 2023

sdcb commented Jul 12, 2023

yaomichael commented Jul 12, 2023

yaomichael commented Jul 12, 2023

sdcb commented Jul 12, 2023 •

edited

Loading

sdcb commented Jul 12, 2023

apple2333cream commented Aug 3, 2023

sdcb commented Aug 3, 2023

github-actions bot commented Jan 3, 2024

sdcb commented Jan 6, 2024

jcyrss commented Jan 11, 2024 •

edited

Loading

LLee233 commented May 13, 2024

UserWangZz commented May 16, 2024

PaddleOCR v4模型使用Mkldnn在非AVX512 CPU上变得非常慢 #10346

PaddleOCR v4模型使用Mkldnn在非AVX512 CPU上变得非常慢 #10346

Comments

sdcb commented Jul 11, 2023 • edited Loading

magicleo commented Jul 12, 2023

yaomichael commented Jul 12, 2023

sdcb commented Jul 12, 2023

yaomichael commented Jul 12, 2023

yaomichael commented Jul 12, 2023

sdcb commented Jul 12, 2023 • edited Loading

sdcb commented Jul 12, 2023

apple2333cream commented Aug 3, 2023

sdcb commented Aug 3, 2023

github-actions bot commented Jan 3, 2024

sdcb commented Jan 6, 2024

jcyrss commented Jan 11, 2024 • edited Loading

LLee233 commented May 13, 2024

UserWangZz commented May 16, 2024

sdcb commented Jul 11, 2023 •

edited

Loading

sdcb commented Jul 12, 2023 •

edited

Loading

jcyrss commented Jan 11, 2024 •

edited

Loading