Banana-zero / spider

爬虫学习记录

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

spider爬虫学习记录

内容均为爬虫教程仓库的代码实现

  • urllibrequests都可以用来获取html页面内容,可以使用正则表达式进行解析
  • beautiful soup是方便解析html的工具,替代正则表达式
  • selenium用来模拟浏览器操作
  • phantomjs也可以模拟浏览器操作,但是取消了可视化界面

About

爬虫学习记录


Languages

Language:Jupyter Notebook 100.0%