kifast / slylearnpython

学习爬虫的小小集合

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

sly的个人学习爬虫文件夹

##这个文件夹包含的爬虫有:

###1.天眼查:企业信息 天眼查的小小spider.py

###2.抓取指定ID的微博爬虫 这是简书的呆亮写的一个模拟cookies登陆的一个爬虫 功能是爬取指定ID下的所有图片和文字

###3.爬取GEEK学院视频的爬虫 这个是我自己学习的然后模仿出来做的一个

###4.融图E贷 这个是不完整得模拟登陆 其中包含我自己自豪的验证码识别函数虽然不到三十行那个函数 但是可以识别四位数字或者没有旋转的字母

###5.new融图E贷 这个是我第一次用cookies模拟登陆获得指定数据所做的一个爬虫

###6.草榴爬虫 这个爬虫写的很简单 感觉爬去他也没什么技术含量 批量某个板块的图片下载到yellowpic里面 一次性大概可以下载几千张吧~自己看个半个小时是够了

###7. 新添加的花瓣网修改测试 将原先的3.x版本换成2.x

##PS:未来准备添加的爬虫有:

###1.草榴种子爬虫 准备批量thunder下载地址然后放在剪贴板(迅雷自己会自动检测)然后迅雷批量下载

About

学习爬虫的小小集合


Languages

Language:Python 100.0%