Releases: hiroi-sora/PaddleOCR-json
PaddleOCR-json v1.4.1
v1.4.1 主要更新内容
- 推理后端 Paddle Inference 由于
3.0.0
的不稳定性,沿用2.3.2
旧版推理库。 - 修复:语言库
繁体中文
配置文件不正确的问题。 - Linux 发行版 :
glibc
依赖库向下调整至2.31
版本,兼容 debian-11、ubuntu-20.04 及以上的发行版。
发布包说明
所有发布包默认已附带 简中,繁中,英,日,韩,俄
多国语言识别库。如有需要,您可参考 README 删除不需要的库来节省空间。
Windows
- PaddleOCR-json_v1.4.1_windows_x64.7z (88.4MB)
- SHA256:
c0912a70acb1f8f18fafe1f438a2935292a6ec7e2859156fa48a33e91358d71d
支持:Windows 7 及以上的系统。
Linux
- PaddleOCR-json_v1.4.1_debian_x64_glibc2.31.tar.xy (118.4MB)
- SHA256:
92a8e5bfe668e1ddec161cd3525c90756cc4c7c608e451a7a2872eb9066d456b
已通过测试的系统:Debian 11/12
, Ubuntu 20.04/22.04
, Kali 2023.3
。若您运行时提示缺少库文件,请根据报错内容,安装对应的系统组件。
此发布包不一定兼容所有 Linux 系统。可参考 Linux 构建指南 、 Docker 部署指南 ,从源码构建本项目。
OpenCV 预构建依赖库(不是项目本体!!)
- opencv_410_debian_x64_glibc2.31.zip (21.5MB)
- SHA256:
ce7f0aa00420a15d2c2b027dffa53466d6d7772404c243cc8b30aecc5b4630ba
适合 PaddleOCR-json 项目的轻量化 OpenCV 依赖库。供开发者从源码构建 PaddleOCR-json 时使用。
PaddleOCR-json v1.4.1 dev
此 Release 为开发中的测试版。您也可以选择 稳定版 。
CPU兼容性注意!
由于 Paddle Inference 新版推理后端的一些问题(#10346),
新版程序+新版模型库(V4),在 非AVX512 处理器上的运行速度较慢。
支持 AVX512 指令集的处理器:
Intel: 酷睿10代及之后的 i5、i7、i9 ,至强
AMD: 锐龙7代及之后的 R5、R7、R9
Windows 可通过 cpu-z 查看CPU指令集,Linux可通过lscpu | grep avx
查看。
如果您的CPU不支持AVX512,或者使用 PaddleOCR-json v1.4.1 dev
时发现速度明显下降,可行的解决方案:
- 新版程序+旧版模型库(V3)。下载 models_1.3 ,替换到 PaddleOCR-json v1.4.1 的 models 目录。
- 暂时使用 稳定版程序 。
v1.4.1 dev 目前更新
- 更新推理后端至 Paddle Inference
3.0.0 beta-1
。 - 大幅优化内存占用:峰值由 2.5GB 降至约 1.5GB 。
- 增加命令行参数:内存自动清理界限
--cpu_mem
。见 文档 。 - 小幅优化初始化耗时。
- 支持
PP-OCR V4
系列模型库,及PPOCR算法挑战赛 冠军方案模型库 。 - 由于语言库
cyrillic
(斯拉夫字母/俄语)的准确度较低、使用频率较低,发行包中不再包含此语言库。有需要的用户可 自行下载 。 - Python API: 修复了布尔类型启动参数设为
False
不生效的问题。 - 测试版中,可能在 stderr 管道输出额外的调试信息(如内存占用等)。
发布包说明
发布包默认附带 简中,繁中,英,日,韩
语言库。如有需要,您可参考 README 删除不需要的库来节省空间。
PaddleOCR-json v1.4.0
v1.4.0 主要更新内容
- 支持 Linux 平台。
- 返回值新增:文字方向分类相关参数。 👉 返回值说明
- 出于安全考虑,默认弃用 剪贴板读取 功能。(如有需要,可参考项目构建指南启用该功能)
发布包说明
所有发布包默认已附带 简中,繁中,英,日,韩,俄
多国语言识别库。如有需要,您可参考 README 删除不需要的库来节省空间。
Windows
- PaddleOCR-json_v1.4.0_windows_x86-64.7z (98.4MB)
- SHA256:
25f31dacc982a7b72912f5d1f362e2b73ecb3b851eb0bed880dd85ca512df3ca
支持:Windows 7 及以上的系统。
Linux
- PaddleOCR-json_v1.4.0_debian_gcc_x86-64.tar.xz (126.5MB)
- SHA256:
9c1669dcdafb0a5bfefa593042a7bfcf714580156a2da5e2d6bb9b9c47dbf9c3
已通过测试的系统:Debian 12
, Ubuntu 22.04
, Kali 2023.3
。若您运行时提示缺少库文件,请根据报错内容,安装对应的系统组件。
此发布包不一定兼容所有 Linux 系统。可参考 Linux 构建指南 、 Docker 部署指南 ,从源码构建本项目。
PaddleOCR-json v1.4.0 Beta 2
v1.4.0 主要更新内容
- 支持 Linux 平台。
- 出于安全考虑,默认弃用剪贴板读取功能。(如有需要,可参考项目构建指南启用该功能)
v1.4.0 beta.2 更新
- 返回值新增:文字方向分类相关参数。 👉 返回值说明
此 Release 为测试版,欢迎提 Issue 报告问题。
发布包说明
所有发布包默认已附带 简中,繁中,英,日,韩,俄,德,法
多国语言识别库。如有需要,您可参考 README 删除不需要的库来节省空间。
Windows
- PaddleOCR-json_v1.4.0.beta.2_windows_x86-64.7z (98.4MB)
- SHA256:
25f31dacc982a7b72912f5d1f362e2b73ecb3b851eb0bed880dd85ca512df3ca
支持:Windows 7 及以上的系统。
Linux
- PaddleOCR-json_v1.4.0.beta.2_debian_gcc_x86-64.tar.xz (126.5MB)
- SHA256:
9c1669dcdafb0a5bfefa593042a7bfcf714580156a2da5e2d6bb9b9c47dbf9c3
已通过测试的系统:Debian 12
, Ubuntu 22.04
, Kali 2023.3
。若您运行时提示缺少库文件,请根据报错内容,安装对应的系统组件。
此发布包不一定兼容所有 Linux 系统。可参考 Linux 构建指南 、 Docker 部署指南 ,从源码构建本项目。
OpenCV 预构建依赖库(不是项目本体!!)
- opencv-release_debian_x86-64.zip (21.5MB)
- SHA256:
363c82bbe32d04d9de748979557581d20258ebc8eb285251a6b898f7b0578568
适合 PaddleOCR-json 项目的轻量化 OpenCV 依赖库。供开发者从源码构建 PaddleOCR-json 时使用。
PaddleOCR-json v1.4.0 Beta
v1.4.0 主要更新内容
- 支持 Linux 平台。
- 出于安全考虑,默认弃用剪贴板读取功能。(如有需要,可参考项目构建指南启用该功能)
此 Release 为测试版,可能含有潜在的缺陷。Windows用户可以继续使用 v1.3.1 版本。
软件版本
所有发布包默认已附带 简中,繁中,英,日,韩,俄,德,法
多国语言识别库。如有需要,您可参考README删除不需要的库来节省空间。
Windows:
PaddleOCR-json_v1.4.0.beta_windows_x86-64.7z (96.2MB)
SHA256: bd176a3bdff3aa4f05cbd57e4a1c4444517065e1d3bfccf49d5ab98043c6291b
支持:Windows 7 及以上的系统。
Linux:
PaddleOCR-json_v1.4.0.beta_debian_gcc_x86-64.tar.xz (126.3MB)
SHA256: 062d654850f0c6e97baadc207f6cc7e0f766327768827c719c9027ffe355e0cb
已通过测试的系统:Debian 12
, Ubuntu 22.04
, Kali 2023.3
。若您运行时提示缺少库文件,请根据报错内容,安装对应的系统组件。
此发布包不一定兼容所有 Linux 系统。可参考 Linux 构建指南 、 Docker 部署指南 ,从源码构建本项目。
PaddleOCR-json v1.3.1
下载 PaddleOCR-json.v1.3.1.7z
。
解压,点击 PaddleOCR-json.exe
测试程序,或参考 README
通过API调用。
默认已附带 简中,繁中,英,日,韩,俄,德,法
多国语言识别库。如有需要,您可参考README删除不需要的库来节省空间。
v1.3.1 主要更新内容:
- 兼容 Win7 x64 。
- (若 Win7 报错
计算机中丢失 VCOMP140.DLL
,请安装 VC运行库 )
SHA256: 9ebc13cd2facc85f7986c9358e805a6d95c35d769a626a3c9fbb5a53d34d43b5
models v1.3
模型库文件
2024.7.5 更新:
- 添加 全语言描述文件
configs.txt
(Umi-OCR依赖)
2024.8.19 更新:
- 修复有关繁体中文的配置文件错误
- 移除无用的rec库
PaddleOCR-json v1.3.0
PaddleOCR-json v1.3.0 Alpha
这是一个重构版本,重写了部分代码,并新增了以下功能:
- 可通过Base64字符串传输图片。可实现完全意义上的内存传图,无需用本地文件或剪贴板来中转。
- 添加新交互模式:套接字服务器模式,通过TCP接受客户端的指令。
指令基本兼容旧版,删除了一些不好用或意义不大的功能,如 use_debug
和参数热更新机制等。
由于源项目PPOCR并未更新,所以本项目v1.3与v1.2在OCR性能和准度上没有任何变化;旧版v1.2已经能满足需求的用户无需升级v1.3。
旧版用户如需升级,请再阅读一次README和详细使用指南等项目文档。
alpha 是先行测试版,可能含有未知的问题或不稳定的因素,欢迎提issue。
为方便测试,PaddleOCR-json_v.1.3.0_alpha.x.7z
已包含 简中,繁中,英,日,韩,俄,德,法
全部语言识别库。
alpha.2
更新:
修复了套接字模式在非本地环回下,服务端接收数据不完整的问题
PaddleOCR-json v1.2.1
下载 PaddleOCR-json.v1.2.1.7z
。
解压,点击 PaddleOCR_json.exe
测试程序,或参考 README
通过API调用。
v1.2.1主要更新内容:
- 修复了一些BUG。
- 解决非中文windows难以读取中文路径的问题,拥抱utf-8,彻底摆脱对gbk等区域性编码的依赖。
- 新功能:直接读取并识别剪贴板内存中的图片。
- 错误代码和提示更详细。
- 更新了一些输出格式,如文本包围盒box的定义
- 注意,API与
v1.2.0
不通用