Build software better, together

opendatalab / MinerU

Transforms complex documents like PDFs into LLM-ready markdown/JSON for your Agentic workflows.

python pdf parser ocr pdf-converter extract-data document-analysis pdf-parser layout-analysis ai4science pdf-extractor-rag pdf-extractor-llm pdf-extractor-pretrain

Updated Apr 10, 2026
Python

bytedance / Dolphin

Star

The official repo for “Dolphin: Document Image Parsing via Heterogeneous Anchor Prompting”, ACL, 2025.

python pdf parser ocr pdf-converter document-analysis pdf-parser layout-analysis vlm-ocr

Updated Mar 25, 2026
Python

Layout-Parser / layout-parser

Star

A Unified Toolkit for Deep Learning Based Document Image Analysis

ocr computer-vision deep-learning object-detection document-image-processing layout-analysis document-layout-analysis detectron2 layout-parser layout-detection

Updated Aug 15, 2024
Python

kotaro-kinoshita / yomitoku

Sponsor

Star

YomiTokuはAIを活用した日本語文書解析エンジンを提供するPythonパッケージです。 Yomitoku is an AI-powered document image analysis package designed specifically for the Japanese language.

python ocr deep-learning pytorch layout-analysis

Updated Apr 9, 2026
Python

mittagessen / kraken

Star

OCR engine for all the languages

ocr neural-networks hocr optical-character-recognition htr handwritten-text-recognition alto-xml page-xml layout-analysis

Updated Apr 7, 2026
Python

opendatalab / MinerU-Diffusion

Star

A diffusion-based framework for document OCR that replaces autoregressive decoding with block-level parallel diffusion decoding.

python pdf parser ocr pdf-converter extract-data dlm document-analysis diffusion pdf-parser layout-analysis ai4science pdf-extractor-rag pdf-extractor-llm pdf-extractor-pretrain llada

Updated Mar 31, 2026
Python

mindspore-lab / mindocr

Star

A toolbox of ocr models and algorithms based on MindSpore

ocr deep-learning text-recognition text-detection layout-analysis crnn dbnet table-recognition mindspore key-information-extraction layoutxlm ocr-large-model tablemaster vary-toy

Updated Jul 24, 2025
Python

RapidAI / RapidLayout

Star

Analysis of Chinese and English layouts 中英文版面分析

layout layout-analysis cdla pp-structure doclayout-yolo

Updated Mar 24, 2026
Python

RapidAI / RapidDocEx

Star

📝 针对文档类图像做内容提取，将文档类图像一比一输出到Word或者Txt中，便于进一步使用或处理。后续计划支持输入PDF/图像，输出对应json格式、Txt格式、Word格式和Markdown格式。

layout-analysis layout-recover

Updated Nov 1, 2024
Python

FreeOCR-AI / yolo-doclaynet

Star

YOLO models trained by DocLayNet - power your Document Intelligent by Layout Analysis

yolo document-analysis layout-analysis ultralytics yolov8 doclaynet

Updated Mar 10, 2026
Python

NormXU / Layout2Graph

Star

An official implementation of paper "Paragraph2Graph: A Language-independent GNN-based framework for layout analysis"

layout-analysis gnn-framework

Updated Oct 14, 2023
Python

CycloneBoy / pdf_table

Star

A Unified Toolkit for Deep Learning-Based Table Extraction

pdf ocr ai table layout-analysis pdf-to-html table-recognition document-parsing

Updated Nov 21, 2024
Python

JPLeoRX / detectron2-publaynet

Star

Trained Detectron2 object detection models for document layout analysis based on PubLayNet dataset

python machine-learning computer-vision deep-learning neural-network python3 pytorch artificial-intelligence neural-networks faster-rcnn document-classification object-detection document-analysis document-layout instance-segmentation layout-analysis document-layout-analysis detectron2 publaynet

Updated Apr 16, 2023
Python

MaitySubhajit / SelfDocSeg

Star

[ICDAR 2023] SelfDocSeg: A self-supervised vision-based approach towards Document Segmentation (Oral)

computer-vision layout-analysis self-supervised-learning document-segmentation

Updated Oct 6, 2023
Python

CaseDrive / publaynet-models

Star

Trained Detectron2 object detection models for document layout analysis based on PubLayNet dataset

python machine-learning computer-vision deep-learning neural-network python3 pytorch artificial-intelligence neural-networks faster-rcnn document-classification object-detection document-analysis document-layout instance-segmentation layout-analysis document-layout-analysis detectron2 publaynet

Updated Apr 16, 2023
Python

MBAigner / PDFSegmenter

Star

This library builds a graph-representation of the content of PDFs. The graph is then clustered, resulting page segments are classified and returned. Tables are retrieved formatted as a CSV.

python pdf csv table annotations cluster-analysis document-processing layout-analysis detection-model page-segmentation

Updated Sep 11, 2020
Python

VRI-UFPR / ocrd-gbn

Star

OCR-D compliant toolset for optical layout recognition on historical german-language documents published in Brazil

ocr tensorflow segmentation binarization layout-analysis historical-documents ocr-d

Updated Sep 24, 2021
Python

yuvaraj-kannan / preocr

Star

Fast document classification and OCR detection. Analyzes any file type to determine if OCR is needed, saving time and money on unnecessary processing.

Updated Apr 6, 2026
Python

pleb631 / pdfLayoutDet

Star

pdfDet aims to simplify PDF layout detect tasks for users.

document-analysis layout-analysis pdf-document-processor layout-parser layout-detection

Updated Mar 28, 2024
Python

yoshihikoueno / pdfminer-layout-scanner

Star

A more complete example of programming with PDFMiner, which continues where the default documentation stops

python pdf text-extraction pdfminer layout-analysis

Updated Jul 24, 2019
Python

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

layout-analysis

Here are 55 public repositories matching this topic...

opendatalab / MinerU

bytedance / Dolphin

Layout-Parser / layout-parser

kotaro-kinoshita / yomitoku

mittagessen / kraken

opendatalab / MinerU-Diffusion

mindspore-lab / mindocr

RapidAI / RapidLayout

RapidAI / RapidDocEx

FreeOCR-AI / yolo-doclaynet

NormXU / Layout2Graph

CycloneBoy / pdf_table

JPLeoRX / detectron2-publaynet

MaitySubhajit / SelfDocSeg

CaseDrive / publaynet-models

MBAigner / PDFSegmenter

VRI-UFPR / ocrd-gbn

yuvaraj-kannan / preocr

pleb631 / pdfLayoutDet

yoshihikoueno / pdfminer-layout-scanner

Improve this page

Add this topic to your repo