huihuidehui / zhihu-image-crawler

一个爬取知乎问题下所有回答图片的小爬虫。

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

爬取知乎某个问题下所有回答的图片

使用的python模块包括,grequest、click.参考文章

使用

  1. clone到你的电脑 git clone https://github.com/laodiaoyadashu/zhihu-image-crawler.git
  2. 切换目录 cd zhihu-image-crawler
  3. 安装依赖 pip install -r requirements.txt
  4. 命令说明 python main.py接受两个参数,你也可以使用python main.py --help获取帮助。

参数说明

  1. question: 你想要爬取的问题id,例如在这个问题中question就是296631231 https://www.zhihu.com/question/296631231
  2. votenum: 将会过滤掉点赞数小于该值的回答. 例如:python main.py --question 296631231 --votenum 1000

注意

代码中加入了sleep用来减小爬虫的频率。不管怎么爬,一定要保证知乎正常的服务。

运行截图

About

一个爬取知乎问题下所有回答图片的小爬虫。


Languages

Language:Python 100.0%