基于cookie爬取牛客网需要登录访问的试题
想法就是用程序一次将30题全部爬下。随后生成新的试卷再进行爬虫。
进入网页可以看到,如果选择《数据结构》的某个知识点组卷,一次最多只能出30题。
用程序一次将30题全部爬下。随后手动生成新的试卷再进行爬虫。
- 进入试题解析界面,进入第一题,复制链接。
- 在Chrome中打开开发者工具,获得与登录相关的cookie。
- 将它们放入到下图的变量中
python3 nq-crawler.py
效果
基于cookie方法的爬虫,爬取牛客网需要登录访问的试题
基于cookie爬取牛客网需要登录访问的试题
想法就是用程序一次将30题全部爬下。随后生成新的试卷再进行爬虫。
进入网页可以看到,如果选择《数据结构》的某个知识点组卷,一次最多只能出30题。
用程序一次将30题全部爬下。随后手动生成新的试卷再进行爬虫。
python3 nq-crawler.py
效果