ocrbook / ocrinaction

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

《深度实践OCR:基于深度学习的文字识别》 随书代码

The source code and dataset of 《深度实践OCR:基于深度学的文字识别》

本书主要是面向文字识别初、中级学习从业人员,介绍了OCR的各类方法,既包括图像预处理、数据生成与增强、文字检测与识别等基础内容,又有与神经网络和目标检测相结合的内容。 由于是第一版,还存在非常多的问题,我们也希望能够把这本书完善好,为国内的初学者提供一个体系化的入门路径,所以非常期待各位读者朋友提出改进意见。

环境

本书代码默认运行在ubuntu系统,主要依赖pytorch,Numpy,Opencv,Pillow。

1.安装依赖

pip install -r requirements.txt

章节安排

  • chapter-2 图像预处理方法
  • chapter-3 传统机器学习方法
  • chapter-4 深度学习的相关基础知识
  • chapter-5 数据生成
  • chapter-6 高级深度学习方法
  • chapter-7 文字检测技术
  • chapter-8 文字识别
  • chapter-9 OCR后处理的方法
  • chapter-10 版面分析方法

其他

在第五章节补充了数据集的部分,读者可以用于训练检测和识别网络。 目前已经全部补充完整,由于部分作者不维护,导致我肝的特别累,加上996的工作,有可能无法及时反馈,读者朋友们可以发我的邮箱。

About


Languages

Language:C++ 90.3%Language:Python 9.3%Language:Component Pascal 0.2%Language:MATLAB 0.2%