keras-ctpn

[TOC]

说明
预测
训练
例子
toDoList

说明

本工程是keras实现的CPTN: Detecting Text in Natural Image with Connectionist Text Proposal Network .

cptn论文翻译:CTPN.md

关键点说明:

a.骨干网络使用的是resnet50

b.训练输入图像大小为608*608; 将图像的长边缩放到608,保持长宽比,短边padding

c.batch_size 为4, 每张图像训练256个anchor,正负样本比为1:1

预测

a. 工程下载

git clone https://github.com/yizt/keras-ctpn

b. 预训练模型下载

ICDAR2015训练集上训练好的模型下载地址：ctpn.h5 提取码:kqso

ICDAR2017训练集上训练好的模型下载地址：ctpn.025.h5 提取码:rpsk

c.修改配置类config.py中如下属性

	WEIGHT_PATH = '/tmp/ctpn.h5'

d. 检测文本

python predict.py --image_path image_3.jpg

训练

a. 训练数据下载

icdar2015下载地址(官网打开太慢): https://download.csdn.net/download/moonshapedpool/10645292

#icdar2017
wget -c -t 0 http://datasets.cvc.uab.es/rrc/ch8_training_images_1~8.zip
wget -c -t 0 http://datasets.cvc.uab.es/rrc/ch8_training_localization_transcription_gt_v2.zip
wget -c -t 0 http://datasets.cvc.uab.es/rrc/ch8_test_images.zip

b. resnet50与训练模型下载

wget https://github.com/fchollet/deep-learning-models/releases/download/v0.2/resnet50_weights_tf_dim_ordering_tf_kernels_notop.h5

c. 修改配置类config.py中，如下属性

	# 预训练模型
    PRE_TRAINED_WEIGHT = '/opt/pretrained_model/resnet50_weights_tf_dim_ordering_tf_kernels_notop.h5'

    # 数据集路径
    IMAGE_DIR = '/opt/dataset/OCR/ICDAR_2015/train_images'
    IMAGE_GT_DIR = '/opt/dataset/OCR/ICDAR_2015/train_gt'

d.训练

python train.py --epochs 50

例子

ICDAR2015

ICDAR2017

由于ICDAR2017测试集还未下载完，任然是ICDAR2015的测试样例

toDoList

侧边改善
ICDAR2017数据集训练
检测文本行坐标映射到原图
精度评估

About

A Keras implementation of CTPN text detector

Apache License 2.0

Languages

Language:Python 100.0%