layout-analysis

There are 11 repositories under layout-analysis topic.

opendatalab / MinerU
A high-quality tool for convert PDF to Markdown and JSON.一站式开源高质量数据提取工具，将PDF转换成Markdown和JSON格式。
extract-data layout-analysis ocr parser pdf pdf-converter python document-analysis pdf-parser pdf-extractor-llm pdf-extractor-pretrain pdf-extractor-rag ai4science
Language:Python 28662
Layout-Parser / layout-parser
A Unified Toolkit for Deep Learning Based Document Image Analysis
computer-vision deep-learning detectron2 document-image-processing document-layout-analysis layout-analysis layout-detection layout-parser object-detection ocr
Language:Python 5134
breezedeus / Pix2Text
An Open-Source Python3 tool with SMALL models for recognizing layouts, tables, math formulas (LaTeX), and text in images, converting them into Markdown format. A free alternative to Mathpix, empowering seamless conversion of visual content into text-based representations. 80+ languages are supported.
image-to-markdown latex latex-pdf layout-analysis math-formula math-formula-recognition math-ocr mathpix ocr python pytorch table-ocr
Language:Jupyter Notebook 2276
UglyToad / PdfPig
Read and extract text and other content from PDFs in C# (port of PDFBox)
pdfbox pdf pdf-document csharp netstandard pdf-extractor pdf-document-processor pdf-files alto-xml hocr layout-analysis document-analysis page-xml pdf-generation
Language:C# 1925
mittagessen / kraken
OCR engine for all the languages
alto-xml handwritten-text-recognition hocr htr layout-analysis neural-networks ocr optical-character-recognition page-xml
Language:Python 795
BobLd / DocumentLayoutAnalysis
Document Layout Analysis resources repos for development with PdfPig.
alto alto-xml csharp docstrum document-layout-analysis hocr hocr-documents layout-analysis page-segmentation page-xml pdf pdfpig recursive-xy-cut table-extraction tei xy-cut xycut
Language:C# 605
yomitoku
kotaro-kinoshita / yomitoku
Yomitoku is an AI-powered document image analysis package designed specifically for the Japanese language.
deep-learning layout-analysis ocr python pytorch
Language:Python 556
mindspore-lab / mindocr
A toolbox of ocr models and algorithms based on MindSpore
crnn dbnet deep-learning key-information-extraction layout-analysis layoutxlm mindspore ocr ocr-large-model table-recognition tablemaster text-detection text-recognition vary-toy
Language:Python 255
RapidAI / RapidDoc
📝 针对文档类图像做内容提取，将文档类图像一比一输出到Word或者Txt中，便于进一步使用或处理。后续计划支持输入PDF/图像，输出对应json格式、Txt格式、Word格式和Markdown格式。
layout-analysis layout-recover
Language:Python 185
RapidAI / RapidLayout
Analysis of Chinese and English layouts 中英文版面分析
cdla doclayout-yolo layout layout-analysis pp-structure
Language:Python 181
andreagemelli / doc2graph
Doc2Graph transforms documents into graphs and exploit a GNN to solve several tasks.
deep-learning document-understanding geometric-deep-learning gnn key-information-extraction layout-analysis nlp pytorch table-detection
Language:Jupyter Notebook 120
ppaanngggg / yolo-doclaynet
YOLO models trained by DocLayNet - power your Document Intelligent by Layout Analysis
document-analysis layout-analysis ultralytics yolo yolov8 doclaynet
Language:Python 94
NormXU / Layout2Graph
An official implementation of paper "Paragraph2Graph: A Language-independent GNN-based framework for layout analysis"
gnn-framework layout-analysis
Language:Python 77
JPLeoRX / detectron2-publaynet
Trained Detectron2 object detection models for document layout analysis based on PubLayNet dataset
artificial-intelligence computer-vision deep-learning detectron2 document-analysis document-classification document-layout document-layout-analysis faster-rcnn instance-segmentation layout-analysis machine-learning neural-network neural-networks object-detection publaynet python python3 pytorch
Language:Python 48
MaitySubhajit / SelfDocSeg
[ICDAR 2023] SelfDocSeg: A self-supervised vision-based approach towards Document Segmentation (Oral)
computer-vision document-segmentation layout-analysis self-supervised-learning
Language:Python 39
CycloneBoy / pdf_table
A Unified Toolkit for Deep Learning-Based Table Extraction
ai document-parsing layout-analysis ocr pdf pdf-to-html table table-recognition
Language:Python 32
dell-research-harvard / HJDataset
A Large Dataset of Historical Japanese Documents with Complex Layouts
dataset detectron2 python layout-analysis
Language:Jupyter Notebook 32
BobLd / PdfPigMLNetBlockClassifier
Proof of concept of training a simple Region Classifier using PdfPig and ML.NET (LightGBM). The objective is to classify each text block in a pdf document page as either title, text, list, table and image.
classifier csharp document-layout document-layout-analysis layout-analysis lightgbm machine-learning ml-net pdf pdf-document pdf-document-processor pdfpig publaynet
Language:C# 27
CaseDrive / publaynet-models
Trained Detectron2 object detection models for document layout analysis based on PubLayNet dataset
artificial-intelligence computer-vision deep-learning detectron2 document-analysis document-classification document-layout document-layout-analysis faster-rcnn instance-segmentation layout-analysis machine-learning neural-network neural-networks object-detection publaynet python python3 pytorch
Language:Python 27
jiangnanboy / layout_analysis4j
利用java-yolov8实现版面检测（Chinese layout detection），java-yolov8 is used to detect the layout of Chinese document images
cdla java layout-analysis yolo yolov8
Language:Java 25
MBAigner / PDFSegmenter
This library builds a graph-representation of the content of PDFs. The graph is then clustered, resulting page segments are classified and returned. Tables are retrieved formatted as a CSV.
pdf document-processing python page-segmentation layout-analysis cluster-analysis annotations csv table detection-model
Language:Python 22
empressabyss / nordrassil
Nordrassil is a keyboard layout that provides an elegant and balanced typing experience by its use of a thumb-alpha, emphasis on middle fingers, deprioritisation of pinkies, and repeat key (or arcane keys).
dactyl keyboard-layout keyboards layout-analysis layouts qmk arcane warcraft
21
VRI-UFPR / ocrd-gbn
OCR-D compliant toolset for optical layout recognition on historical german-language documents published in Brazil
ocr-d ocr layout-analysis segmentation binarization historical-documents tensorflow
Language:Python 10
pleb631 / PdfDet
PdfDet aims to simplify PDF layout detect tasks for users.
pdf-document-processor layout-analysis layout-detection layout-parser document-analysis
Language:Python 9
yoshihikoueno / pdfminer-layout-scanner
A more complete example of programming with PDFMiner, which continues where the default documentation stops
pdf pdfminer python text-extraction layout-analysis
Language:Python 8
aidayang / MinerU-OneClick
MinerU免安装部署一键启动整合包
ai4science document-analysis extract-data layout-analysis markdown ocr parser pdf pdf-converter pdf-extractor-llm pdf-extractor-pretrain pdf-extractor-rag pdf-parser pdftojson pdftomarkdown python mineru
6
calfa-co / rasam-dataset
Open Dataset for the Recognition and Analysis of Scripts in Arabic Maghrebi (ICDAR 2021, CHR 2024)
dataset htr layout-analysis historical-manuscripts arabic text-recognition
6
VRI-UFPR / page-xml-draw
A powerful CLI tool for visualization and encoding of PAGE-XML files
page-xml visualization image-map opencv ocr layout-analysis segmentation
Language:Python 6
os-climate / crrf-det
A web application for PDF content and table extraction, featuring image-based visual layout analysis, indexed document search, batch processing and extraction result annotation.
annotation data-extraction layout-analysis pdf table-extraction
Language:C++ 5
heshiming / paddlefish
A Python + C implementation for image-based PDF page layout analysis and content extraction.
image-analysis image-processing image-segmentation layout-analysis pdf pdf-extraction pdf-extractor table-extraction
Language:C++ 2
rithulkamesh / docproc
Opinionated and Sophisticated Document Region Analyzer.
content-extraction data-extraction document-analysis document-parsing equation-detection layout-analysis machine-learning mathematical-symbols ocr pdf-processing pdf-text-extraction python region-detection text-classification text-extraction
Language:Python 2
calfa-co / chi-know-po
HTR ground truth of the Chi-Know-Po project (Collex Persée)
chinese dataset historical-manuscripts htr layout-analysis
1
calfa-co / Patrologia-Graeca
Main repository of the CGPG project for OCR and Text Analysis of the Patrologia Graeca
ancient-greek dataset historical-documents layout-analysis ocr text-analysis
Language:GLSL 1
CharleyXu / layout4j
Perform layout analysis on PDFs and images to obtain layout regions, then sort these regions to extract text content in human reading order.
layout onnx layout-analysis sorting-algorithm
Language:Java 1
ixalodecte / filestruct
A python package to structure files using visual and style informations
layout-analysis parser pdf
Language:Python 1
marinagiardinetti / layout-parser-newspapers
Layout Parser notebook Implementation & Re-trained model for Image detection and extraction
digital-humanities image-recognition layout-analysis layout-parser newspapers
Language:Jupyter Notebook 1

layout-analysis

opendatalab / MinerU

Layout-Parser / layout-parser

breezedeus / Pix2Text

UglyToad / PdfPig

mittagessen / kraken

BobLd / DocumentLayoutAnalysis

kotaro-kinoshita / yomitoku

mindspore-lab / mindocr

RapidAI / RapidDoc

RapidAI / RapidLayout

andreagemelli / doc2graph

ppaanngggg / yolo-doclaynet

NormXU / Layout2Graph

JPLeoRX / detectron2-publaynet

MaitySubhajit / SelfDocSeg

CycloneBoy / pdf_table

dell-research-harvard / HJDataset

BobLd / PdfPigMLNetBlockClassifier

CaseDrive / publaynet-models

jiangnanboy / layout_analysis4j

MBAigner / PDFSegmenter

empressabyss / nordrassil

VRI-UFPR / ocrd-gbn

pleb631 / PdfDet

yoshihikoueno / pdfminer-layout-scanner

aidayang / MinerU-OneClick

calfa-co / rasam-dataset

VRI-UFPR / page-xml-draw

os-climate / crrf-det

heshiming / paddlefish

rithulkamesh / docproc

calfa-co / chi-know-po

calfa-co / Patrologia-Graeca

CharleyXu / layout4j

ixalodecte / filestruct

marinagiardinetti / layout-parser-newspapers