Vincent131499 / Chinese-OCR3

从NLP出发对于OCR的深度实践集锦,重在实战

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

Chinese-OCR3:面向中文的OCR深度实践系列

目前NLP+OCR的落地应用在市场上愈加火热,如金融领域的研报分析、司法领域的合同审核甚至知识图谱的信息抽取,无不显示着NLP与OCR融合的巨大魅力。

本文将针对OCR从理论实战两方面进行详细论述,当然,不会涉及过多的公式,网上对于公式解析已经很全面,若感兴趣可自行查找。

实验环境配置

本项目下的所有模型均在以下环境中测试成功:
python版本:python3.6
系统:ubuntu18.04
pytorch:1.2.0
tensorflow:1.14.0

目前章节系列已更新完毕:

(一)OCR深度实践系列:图像预处理
(二)OCR深度实践系列:数据生成
(三)OCR深度实践系列:文本检测
(四)OCR深度实践系列:文本识别
(五)OCR深度实践系列:后处理篇

About

从NLP出发对于OCR的深度实践集锦,重在实战


Languages

Language:C++ 72.6%Language:Python 26.2%Language:Jupyter Notebook 0.8%Language:MATLAB 0.3%Language:Shell 0.1%Language:Dockerfile 0.0%