lordlight / cnvd_requests_spider

使用requests库实现爬取cnvd漏洞详情,selenium库获取cookie反反爬,使用sqlalchemy存储数据

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

爬取cnvd最近3年的漏洞详情

环境

软件 版本
python 3.6
requests
sqlalchemy
selenium
chromedriver
mysql 5.7

sudo python3 -m pip install --upgrade pip

sudo python3 -m pip install --upgrade setuptools

sudo python3 -m pip install -i https://pypi.tuna.tsinghua.edu.cn/simple/ requests

sudo python3 -m pip install -i https://pypi.tuna.tsinghua.edu.cn/simple/ selenium

sudo python3 -m pip install -i https://pypi.tuna.tsinghua.edu.cn/simple/ sqlalchemy

  • chrome与chromedriver安装自行百度

功能

  • 按顺序依次爬取cnvd的漏洞详情,起始url在代码中修改

  • 使用sqlchemy保存数据,也可以改为csv文件存储

  • 使用selenium反反爬虫,主要是获取cookie,每隔5次爬取自动打开浏览器获取一下新cookie

注意

  • 使用前请务必修改数据库的连接信息与User-Agent,UA必须与chromedriver的版本一致

  • mysql务必使用utf8字符集创建数据库

运行

sudo python3 cnvd2.py

About

使用requests库实现爬取cnvd漏洞详情,selenium库获取cookie反反爬,使用sqlalchemy存储数据


Languages

Language:Python 100.0%