标签: 验证码破解 模拟登陆
准备:
- 安装python3
- 安装tesseract,本人提供的tesseract百度云下载,亲测版本4比较多坑,这是版本3,已经够用的了 链接: http://pan.baidu.com/s/1boHp2Jt 密码: 6trj
-
下载本项目到本地
-
进入主目录,输入以下命令安装相关依赖:
pip install -r requirements.txt
-
输入一下命令运行代码:
python login.py
运行之后打印不少内容: 第一个是一个byte,内容就是下载下来的验证码: 第二个是登陆后的页面: 第三个是我的选课结果:
最后可以发现本地生成了一个after_login.html的html文件,打开之后发现你的选课结果被下载下来了:
- icode模块负责图片去噪和识别验证码
- entryption模块负责加密密码
- login模块负责登陆和抓取一些页面