scanned-documents

There are 5 repositories under scanned-documents topic.

papermerge
ciur / papermerge
Open Source Document Management System for Digital Archives (Scanned Documents)
archives django dms document-management ocr paperless pdf scan scanned-documents
Language:Python 2668
4lex4 / scantailor-advanced
ScanTailor Advanced is the version that merges the features of the ScanTailor Featured and ScanTailor Enhanced versions, brings new ones and fixes.
binarization book-scanning digitalization djvu image-processing scanned-documents
Language:C++ 1312
OMRChecker
Udayraj123 / OMRChecker
Evaluate OMR sheets fast and accurately using a scanner 🖨 or your phone 🤳.
opencv image-processing omr omr-sheet scanner exam checker template document document-scanner scanned-documents grader mcq multiple-choice omr-layout hacktoberfest correction scoring omr-scanner omr-scanning
Language:Python 931
ispras / dedoc
Dedoc is a library (service) for automate documents parsing and bringing to a uniform format. It automatically extracts content, logical structure, tables, and meta information from textual electronic documents. (Parse document; Document content extraction; Logical structure extraction; PDF parser; Scanned document parser; DOCX parser; HTML parser
doc docx odt documents excel pdf txt ocr scanned-documents document-content-extraction table-of-contents table-recognition html docx-parser html-parser pdf-parser document-analysis logical-structure-extraction
Language:Python 595
ahmetozlu / signature_extractor
A super lightweight image processing algorithm for detection and extraction of overlapped handwritten signatures on scanned documents using OpenCV and scikit-image.
image-processing image-segmentation signature-verification signature-detection signature-recognition ocr ocr-engine optical-character-recognition signature-extractor handwritten-signatures scanned-documents signature-extraction-algorithm
Language:Python 496
ad-si / awesome-scanning
A curated list of awesome projects to simplify and improve paper and document scanning.
book-digitization book-scanner book-scanning digitization dms document-scanner page-scanning scanned-documents scanner scanning
Language:Shell 461
papermerge / papermerge-core
Papermerge DMS core backend, REST API server, and frontend UI
dms document-management-system pdf ocr records-management documents scanned-documents digital-archives
Language:TypeScript 380
susam / tucl
The first-ever paper on the Unix shell written by Ken Thompson in 1976 scanned, transcribed, and redistributed with permission
conservation paper pdf scanned-documents scanned-pages shell unix unix-shell
Language:Makefile 366
brakmic / OpenCV
:camera: Computer-Vision Demos
opencv vision computer-vision ocr ocr-recognition scanimage scanned-documents scanning
Language:C# 268
atgreen / paperless
Emacs-assisted PDF document filing
emacs melpa paperless pdf scanned-documents
Language:Emacs Lisp 138
karolzak / boxdetect
BoxDetect is a Python package based on OpenCV which allows you to easily detect rectangular shapes like character or checkbox boxes on scanned forms.
computer-vision cv2 rectangle-detection box-detection forms documents scanned-documents scanned-images scanned-image-pdfs bounding-boxes handwritten-characters handwritten-character-recognition handwritten-documents handwritten-forms opencv opencv-python checkbox checkboxes boxes
Language:Python 111
apurvmishra99 / pdf-to-scan
Make your PDFs look like they were scanned
pdfs imagemagick ghostscript scan scanned-documents
Language:Python 85
Home-DMS
RndUsername / Home-DMS
Categorize your digital documents in a well designed UI, using modern technologies.
app dms document-management document-management-system documents mobile-first pocketbase scanned-documents waku
Language:TypeScript 57
beast / react-native-scan-doc
A document scanner that automatically trims the edge with perspective transform
react-native scanned-documents
Language:Java 40
ApryseSDK / pdftron-android-ocr-scanner-sample
Android Scanner with OCR support using PDFTron
android ocr scanner document-scanner pdf-scanner document-ocr scanned-documents
Language:Kotlin 35
maxim2266 / go-ocr
A tool for extracting text from scanned documents (via OCR), with user-defined post-processing.
go ocr scanned-documents extract-images
Language:Go 34
baltpeter / scanprep
Small utility to prepare scanned documents. Supports separating PDF files by separator pages and removing blank pages.
scanned-documents scanning pdf image-processing hacktoberfest
Language:Python 32
NjoyimPeguy / ICDAR-2019-RRC-SROIE
ICDAR 2019 Robust Reading Challenge on Scanned Receipts OCR and Information Extraction
sroie2019 sroie ocr scanned-documents scanned-receipts receipts text-localization text-classification icdar2019 keyword-extraction
Language:Python 32
papermerge / documentation
Documentation for Papermerge DMS - Installation, Help, User Manual, REST API
dms documentation installation scan ocr document-management scanned-documents archives user-manual help contrbuting
Language:HTML 15
goodday451999 / Character-Segmentation-of-Scanned-Text
Segmentation of Scanned Text upto Character Level
character-segmentation scanned-documents handwritten-documents
Language:Python 12
AdroitAnandAI / Multilingual-Text-Inversion-Detection-of-Scanned-Images
Efficient Text Localization Algorithm, Image Inversion Detection of Scanned Documents & Language Identification based on Shape Context and Traditional Computer Vision.
computer-vision detection efficient image-inversion images inversion language-identification multilingual scanned-documents scanned-images shape shape-context text text-localization traditional-algorithm inversion-detection
Language:Python 9
skconan / Scanned-Document-Rotation-Correction
The project creates the models and service API for predicting scanned document images' angles ranging between -90° to 90° from the vertical.
angle onnx onnxruntime pytorch scanned-documents skew-correction
Language:Python 7
dsabarinathan / DocumentTableSeg
Implementation of scanned document table segmentation with U-net
table scanned-documents segmentation u-net python keras keras-tensorflow
Language:Python 6
imakashsahu / Images-or-Scanned-Documents-into-Searchable-PDFs
This is a Flask Based Project to convert Images, Scanned Documents or Multiple Page PDF into Searchable PDF
final-year-project scanned-documents convert-images flask btech-project project
Language:CSS 6
papermerge / papermerge-cli
Papermerge DMS command line utility
archive command-line-tool dms document-management-system ocr papermerge pdf records-management scanned-documents
Language:Python 6
timberger / Searchable-Image-PDF-Creat-O-Mat
This batch script creates a searchable PDF of a PDF with one or more scanned pages which contain images.
pdf ocr tesseract imagemagick scanned-documents scanned-image-pdfs searchable-pdfs tesseract-wrapper imagemagick-wrapper ghostscript ghostscript-wrapper batch-script scanned-pages converter searchable-pdf batch drag drop scan
Language:Batchfile 6
svitlana1209 / OCR-search
Searching for a text using OCR, detection and recognition of tables in scanned documents.
ocr image pdf computer-vision contour-detection hough-transform opencv pandas-dataframe pytesseract python scanned-documents tesseract text-recognition angle-rotation detect-table-struct
Language:Python 5
vijayengineer / PDFTextSpeechConverter
Converts scanned documents and ordinary documents into speech mp3 using Amazon Polly
aws-polly pdf-text-extraction pdf audiobook speech synthesis scanned-documents images text
Language:Python 5
binDebug3 / scanner_automation
A program to automate simple and repetitive tasks while scanning documents by Dallin Stewart
automation data-entry mortgage pyautogui pyautogui-automation scan-tool scanned-documents
Language:Python 4
deckerego / docmag
The web UI for Facile Search. Together with DocIndex, this UI can help you search the myriad of scanned documents you have been accumulating over the years. Using the power of Docker & Elasticsearch you can run a powerful search engine that lets you convert scanned (image-based) PDFs to searchable text, group documents by letterhead, run fuzzy searches by date and view document metadata.
elasticsearch docker scanned-documents kubernetes full-text-search pdf
Language:Groovy 4
milahu / document-photo-auto-threshold
auto-correct contrast and brightness of photographed document
image-processing postprocessing scan-tool scanned-documents brightness brightness-adjustment contrast contrast-enhancement
Language:Python 3
scan
hacker-or-id / scan
{{scan|tools|software|headware|progress|open|template|log|log|log|softwaretool|}}{[[:wikt:Scan|log scan]]}. #[[:wikt:log scan|log copyright]]. *[[:wikt:log is log|log]]. *[[:wikt:log scan|txt]]. *[[:wikt:log scan|png]]. *[[:wikt:log scan|image image image/category user/category is /category talkname/category username/category done/category in progress/category open]]. -------------------------------------------------------------------------------------------------------------
scans scansnap-organizer scans-xhr-requests scanned-documents scans-directories scancode linux-server linux-kernel ubuntu-server unixporn
2
Hawk453 / OCR_FOR_PDFS
Optical Character Recognition for Scanned Documents
scanned-documents optical-character-recognition opencv ocr pdfs
Language:Python 2
hnjm / papermerge
Open Source Document Management System for Digital Archives (Scanned Documents)
pdf django archives dms document-management hnjm ocr paperless python scan scanned-documents
Language:Python 2
MaxineXiong / Scraping-Scanned-PDF-Docs-using-OCR-with-RPA
This repository contains automation solutions that efficiently extracts text from scanned PDF documents with consistent layouts. Utilizing Tesseract OCR engine, the UiPath RPA robot achieves nearly 90% accuracy, streamlining the process and significantly reducing manual workload.
ocr optical-character-recognition robotic-process-automation rpa scanned-documents scanned-receipts screen-scraping uipath uipath-classic-design uipath-modern-design uipath-studio
2
jcaperella29 / Document_cleaning_CLI
🧠 AI-powered pipeline for cleaning scanned documents. Removes noise, enhances text, auto-tunes model weights, and returns OCR-optimized PDFs via CLI or cloud API.
cli-tool computer-vision deep-learning denoising document-processing image-processing ocr pytesseract python scanned-documents auto-tune batch-processing cloud-run document-ai fastapi image-enhancement ocr-pipelines rest-api ocr-pipeline
Language:MATLAB 1

scanned-documents

ciur / papermerge

4lex4 / scantailor-advanced

Udayraj123 / OMRChecker

ispras / dedoc

ahmetozlu / signature_extractor

ad-si / awesome-scanning

papermerge / papermerge-core

susam / tucl

brakmic / OpenCV

atgreen / paperless

karolzak / boxdetect

apurvmishra99 / pdf-to-scan

RndUsername / Home-DMS

beast / react-native-scan-doc

ApryseSDK / pdftron-android-ocr-scanner-sample

maxim2266 / go-ocr

baltpeter / scanprep

NjoyimPeguy / ICDAR-2019-RRC-SROIE

papermerge / documentation

goodday451999 / Character-Segmentation-of-Scanned-Text

AdroitAnandAI / Multilingual-Text-Inversion-Detection-of-Scanned-Images

skconan / Scanned-Document-Rotation-Correction

dsabarinathan / DocumentTableSeg

imakashsahu / Images-or-Scanned-Documents-into-Searchable-PDFs

papermerge / papermerge-cli

timberger / Searchable-Image-PDF-Creat-O-Mat

svitlana1209 / OCR-search

vijayengineer / PDFTextSpeechConverter

binDebug3 / scanner_automation

deckerego / docmag

milahu / document-photo-auto-threshold

hacker-or-id / scan

Hawk453 / OCR_FOR_PDFS

hnjm / papermerge

MaxineXiong / Scraping-Scanned-PDF-Docs-using-OCR-with-RPA

jcaperella29 / Document_cleaning_CLI