shchsunshine's repositories
163spider
爬取网易客户端内容的小爬虫。
Language:Python000
Language:Java000
EasyOCR
Java OCR 识别组件(基于Tesseract OCR 引擎)。能自动完成图片清理、识别 CAPTCHA 验证码图片内容的一体化工作。Java Image cleanup, OCR recognition component (based Tesseract OCR engine, automatically cleanup image and identification CAPTCHA verification code picture content).
000
Language:Java000
neural-networks-and-deep-learning
Code samples for my book "Neural Networks and Deep Learning"
Nutch2.2.1-Mysql
nutch2.2.1和Mysql 环境的搭建。。。。可以爬下url.但是不知道为什么还有很多空的值在数据库中,还有待继续学习。。这个是备份用的。