Build software better, together

eustro / michael

Star

BA-thesis in history.

ocr pos-tagging layout-analysis historical-documents tree-tagger michael-the-syrian

Updated Jul 13, 2017
Python

yoshihikoueno / pdfminer-layout-scanner

Star

A more complete example of programming with PDFMiner, which continues where the default documentation stops

python pdf text-extraction pdfminer layout-analysis

Updated Jul 24, 2019
Python

MBAigner / PDFSegmenter

Star

This library builds a graph-representation of the content of PDFs. The graph is then clustered, resulting page segments are classified and returned. Tables are retrieved formatted as a CSV.

python pdf csv table annotations cluster-analysis document-processing layout-analysis detection-model page-segmentation

Updated Sep 11, 2020
Python

VRI-UFPR / ocrd-page-xml-draw

Star

OCR-D wrapper for page-xml-draw

visualization ocr segmentation page-xml layout-analysis ocr-d page-xml-draw

Updated May 1, 2021
Python

VRI-UFPR / page-xml-draw

Star

A powerful CLI tool for visualization and encoding of PAGE-XML files

visualization opencv ocr segmentation image-map page-xml layout-analysis

Updated May 19, 2021
Python

VRI-UFPR / ocrd-gbn

Star

OCR-D compliant toolset for optical layout recognition on historical german-language documents published in Brazil

ocr tensorflow segmentation binarization layout-analysis historical-documents ocr-d

Updated Sep 24, 2021
Python

CaseDrive / publaynet-models

Star

Trained Detectron2 object detection models for document layout analysis based on PubLayNet dataset

python machine-learning computer-vision deep-learning neural-network python3 pytorch artificial-intelligence neural-networks faster-rcnn document-classification object-detection document-analysis document-layout instance-segmentation layout-analysis document-layout-analysis detectron2 publaynet

Updated Apr 16, 2023
Python

JPLeoRX / detectron2-publaynet

Star

Trained Detectron2 object detection models for document layout analysis based on PubLayNet dataset

python machine-learning computer-vision deep-learning neural-network python3 pytorch artificial-intelligence neural-networks faster-rcnn document-classification object-detection document-analysis document-layout instance-segmentation layout-analysis document-layout-analysis detectron2 publaynet

Updated Apr 16, 2023
Python

diegosiqueir4 / deepdoctection

Star

A Repo For Document AI

ocr layout-analysis

Updated Apr 27, 2023
Python

MaitySubhajit / SelfDocSeg

Star

[ICDAR 2023] SelfDocSeg: A self-supervised vision-based approach towards Document Segmentation (Oral)

computer-vision layout-analysis self-supervised-learning document-segmentation

Updated Oct 6, 2023
Python

NormXU / Layout2Graph

Star

An official implementation of paper "Paragraph2Graph: A Language-independent GNN-based framework for layout analysis"

layout-analysis gnn-framework

Updated Oct 14, 2023
Python

ixalodecte / filestruct

Star

A python package to structure files using visual and style informations

pdf parser layout-analysis

Updated Mar 9, 2024
Python

pleb631 / PdfDet

Star

PdfDet aims to simplify PDF layout detect tasks for users.

document-analysis layout-analysis pdf-document-processor layout-parser layout-detection

Updated Mar 28, 2024
Python

Layout-Parser / layout-parser

Star

A Unified Toolkit for Deep Learning Based Document Image Analysis

ocr computer-vision deep-learning object-detection document-image-processing layout-analysis document-layout-analysis detectron2 layout-parser layout-detection

Updated Aug 15, 2024
Python

pamudu123 / vote-counter

Star

Automated Election Vote Counting

computer-vision layout-analysis vote-counting llm yolov8

Updated Sep 29, 2024
Python

ppaanngggg / yolo-doclaynet

Star

YOLO models trained by DocLayNet - power your Document Intelligent by Layout Analysis

yolo document-analysis layout-analysis ultralytics yolov8 doclaynet

Updated Oct 7, 2024
Python

RapidAI / RapidLayout

Star

Analysis of Chinese and English layouts 中英文版面分析

layout layout-analysis cdla pp-structure doclayout-yolo

Updated Oct 18, 2024
Python

RapidAI / RapidDoc

Star

📝 针对文档类图像做内容提取，将文档类图像一比一输出到Word或者Txt中，便于进一步使用或处理。后续计划支持输入PDF/图像，输出对应json格式、Txt格式、Word格式和Markdown格式。

layout-analysis layout-recover

Updated Nov 1, 2024
Python

mittagessen / kraken

Star

OCR engine for all the languages

ocr neural-networks hocr optical-character-recognition htr handwritten-text-recognition alto-xml page-xml layout-analysis

Updated Nov 4, 2024
Python

mindspore-lab / mindocr

Star

A toolbox of ocr models and algorithms based on MindSpore

ocr deep-learning text-recognition text-detection layout-analysis crnn dbnet table-recognition mindspore key-information-extraction layoutxlm ocr-large-model tablemaster vary-toy

Updated Nov 4, 2024
Python

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

layout-analysis

Here are 21 public repositories matching this topic...

eustro / michael

yoshihikoueno / pdfminer-layout-scanner

MBAigner / PDFSegmenter

VRI-UFPR / ocrd-page-xml-draw

VRI-UFPR / page-xml-draw

VRI-UFPR / ocrd-gbn

CaseDrive / publaynet-models

JPLeoRX / detectron2-publaynet

diegosiqueir4 / deepdoctection

MaitySubhajit / SelfDocSeg

NormXU / Layout2Graph

ixalodecte / filestruct

pleb631 / PdfDet

Layout-Parser / layout-parser

pamudu123 / vote-counter

ppaanngggg / yolo-doclaynet

RapidAI / RapidLayout

RapidAI / RapidDoc

mittagessen / kraken

mindspore-lab / mindocr

Improve this page

Add this topic to your repo