PaddleOCR-json 的简单 Java 封装。
v1.2 支持本地进程方式,v1.3 支持本地进程&套接字服务客户端方式,v1.4 支持 Linux 版本。
- Gson
- Java 8 或更新版本
- 在项目中引入 'Ocr.java'
- 参考如下代码片段调用 OCR (或参考完整示例 Main.java)
// 可选的配置项
Map<String, Object> arguments = new HashMap<>();
// arguments.put("use_angle_cls", true);
// 使用本地进程方式初始化 OCR
String exePath = "path/to/executable"; // paddleocr_json 的可执行文件所在路径
try (Ocr ocr = new Ocr(new File(exePath), arguments)) {
// 使用套接字服务方式初始化 OCR(仅作为客户端,不启动服务)
// try (Ocr ocr = new Ocr(serverAddr, serverPort, arguments)) {
// 对一张图片进行 OCR
String imgPath = "path/to/img";
OcrResponse resp = ocr.runOcr(new File(imgPath));
// 或者对图片的二进制数据/Base64后的图片进行 OCR
// byte[] fileBytes = Files.readAllBytes(Paths.get(imgPath));
// OcrResponse resp = ocr.runOcrOnImgBytes(fileBytes);
// OcrResponse resp = ocr.runOcrOnImgBase64("base64img");
// 或者直接识别剪贴板中的图片
// OcrResponse resp = ocr.runOcrOnClipboard();
// 读取结果
if (resp.code == OcrCode.OK) {
for (OcrEntry entry : resp.data) {
System.out.println(entry.text);
}
} else {
System.out.println("error: code=" + resp.code + " msg=" + resp.msg);
}
} catch (IOException e) {
e.printStackTrace();
}
- Unicode 转换为 ASCII 序列: EscapedWriter (Soot Project)