jakeywu / image_ocr

图像字符识别

Repository from Github https://github.comjakeywu/image_ocrRepository from Github https://github.comjakeywu/image_ocr

CNN LSTM CTC 基于tensorflow框架构建ocr不定长验证码识别

不定长验证码形态

data/N.png data/ug.png data/vwsizb.png data/身.png

环境 推荐Anaconda mini管理

python3.6.5

tensorflow==1.8.0

项目文件

  1. prepare_data.py 验证码预处理文件, 将如上验证码保留特定颜色字符. 最终生成验证码文件对应正确字符, 存入utils.py中. 采用tf内置Dataset读取方式
  2. image_ocr_model.py 采用CNN特征抽取, LSTM时序+CTC对齐
  3. utils.py 为模型训练样本读取
  4. train_captcha.py 加载训练模型

主要代码/训练效果

  1. 主要代码 data/main_code.png

  2. 训练效果 data/train_result.png

参考文档

CTC基本原理解释

CTC对齐动态图

CTC论文

About

图像字符识别


Languages

Language:Python 100.0%