zhxp308145208 / keras-ctpn

A Keras implementation of CTPN text detector

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

keras-ctpn

[TOC]

  1. 说明
  2. 预测
  3. 训练
  4. 例子
  5. toDoList

说明

​ 本工程是keras实现的CPTN: Detecting Text in Natural Image with Connectionist Text Proposal Network .

​ cptn论文翻译:CTPN.md

关键点说明:

a.骨干网络使用的是resnet50

b.训练输入图像大小为608*608; 将图像的长边缩放到608,保持长宽比,短边padding

c.batch_size 为4, 每张图像训练256个anchor,正负样本比为1:1

预测

a. 工程下载

git clone https://github.com/yizt/keras-ctpn

b. 预训练模型下载

​ ICDAR2015训练集上训练好的模型下载地址:ctpn.h5 提取码:kqso

​ ICDAR2017训练集上训练好的模型下载地址:ctpn.025.h5 提取码:rpsk

c.修改配置类config.py中如下属性

	WEIGHT_PATH = '/tmp/ctpn.h5'

d. 检测文本

python predict.py --image_path image_3.jpg

训练

a. 训练数据下载

icdar2015下载地址(官网打开太慢): https://download.csdn.net/download/moonshapedpool/10645292

#icdar2017
wget -c -t 0 http://datasets.cvc.uab.es/rrc/ch8_training_images_1~8.zip
wget -c -t 0 http://datasets.cvc.uab.es/rrc/ch8_training_localization_transcription_gt_v2.zip
wget -c -t 0 http://datasets.cvc.uab.es/rrc/ch8_test_images.zip

b. resnet50与训练模型下载

wget https://github.com/fchollet/deep-learning-models/releases/download/v0.2/resnet50_weights_tf_dim_ordering_tf_kernels_notop.h5

c. 修改配置类config.py中,如下属性

	# 预训练模型
    PRE_TRAINED_WEIGHT = '/opt/pretrained_model/resnet50_weights_tf_dim_ordering_tf_kernels_notop.h5'

    # 数据集路径
    IMAGE_DIR = '/opt/dataset/OCR/ICDAR_2015/train_images'
    IMAGE_GT_DIR = '/opt/dataset/OCR/ICDAR_2015/train_gt'

d.训练

python train.py --epochs 50

例子

ICDAR2015

ICDAR2017

​ 由于ICDAR2017测试集还未下载完,任然是ICDAR2015的测试样例

toDoList

  1. 侧边改善
  2. ICDAR2017数据集训练
  3. 检测文本行坐标映射到原图
  4. 精度评估

About

A Keras implementation of CTPN text detector

License:Apache License 2.0


Languages

Language:Python 100.0%