12306-captcha

12306验证码识别

1. 训练

通过运行src/tools/download_image.py, 会将12306验证码下载至data/download/all目录.
下载完成后, 通过运行src/tools/cut_image.py, 会将其裁剪为图片和文字两部分, 分别放在data/download/image目录和data/download/words目录.
然后手工对其进行分类, 分别放至data/image和data/words目录. 可以将其分为两部分，分别放在对应的train和test目录.比如,一个示例目录如下:
```
-image
--test
---蜡烛
----1-1.jpg
---沙漠
----2-1.jpg
--train
---蜡烛
----1-2.jpg
---沙漠
----2-2.jpg
```
运行src/image/scripts/create_data.py, 将会生成对应的train.txt和test.txt, 里面包含着训练和测试文件及其类别列表.
运行src/image/scripts/create_lmdb.sh, 将会生成对应的lmdb文件.

可以根据实际情况对src/image/model/image_solver.prototxt文件进行修改.具体修改方法可参考其他模型.

src/image/scripts/image_train.sh和src/image/scripts/image_finetune_train.sh脚本分别用来进行从头训练/微调训练, 训练方法可参考caffe模型训练方法.

src/web提供了一个web测试界面, 运行index.py即可. 运行前, 可以更改对应的模型文件名称. 一个简单示例如下:

基于深度学习的12306验证码识别

Apache License 2.0

Language:Python 77.9%Language:JavaScript 8.5%Language:HTML 7.3%Language:Shell 5.6%Language:CSS 0.7%