Skip to content

WaterLemons2k/ddddocr-basic

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

ddddocr-basic

Basic version of ddddocr (OCR only).


DdddOcr,其由 本作者kerlomz 共同合作完成,通过大批量生成随机数据后进行深度网络训练,本身并非针对任何一家验证码厂商而制作,本库使用效果完全靠玄学,可能可以识别,可能不能识别。

DdddOcr、最简依赖的理念,尽量减少用户的配置和使用成本,希望给每一位测试者带来舒适的体验

项目地址: 点我传送


Logo

一个容易使用的通用验证码识别python库
探索本项目的文档 »

· 报告Bug · 提出新特性

上手指南

环境支持
系统 CPU 备注
Windows 64 位 部分版本 windows 需要安装vc 运行库
Windows 32 位 ×
Linux 64 / ARM64
Linux 32 ×
Macos X64 M1/M2/M3...芯片参考#67
安装步骤

从 pypi 安装

pip install ddddocr-basic

项目底层支持

本项目基于dddd_trainer 训练所得,训练底层框架位 pytorch,ddddocr 推理底层抵赖于onnxruntime,故本项目的最大兼容性与 python 版本支持主要取决于onnxruntime

使用文档

基础 ocr 识别能力

主要用于识别单行文字,即文字部分占据图片的主体部分,例如常见的英数验证码等,本项目可以对中文、英文(随机大小写 or 通过设置结果范围圈定大小写)、数字以及部分特殊字符。

# example.py
import ddddocr

ocr = ddddocr.DdddOcr()

image = open("example.jpg", "rb").read()
result = ocr.classification(image)
print(result)

注意

之前发现很多人喜欢在每次 ocr 识别的时候都重新初始化 ddddocr,即每次都执行ocr = ddddocr.DdddOcr(),这是错误的,通常来说只需要初始化一次即可,因为每次初始化和初始化后的第一次识别速度都非常慢

参考例图

包括且不限于以下图片

captcha

captcha

captcha

captcha

captcha

captcha


captcha

captcha

captcha

captcha

captcha

captcha

About

Basic version of ddddocr (OCR only)

Topics

Resources

License

Stars

Watchers

Forks

Sponsor this project

Languages

  • Python 100.0%