内容均为爬虫教程仓库的代码实现
urllib
和requests
都可以用来获取html页面内容,可以使用正则表达式进行解析beautiful soup
是方便解析html的工具,替代正则表达式selenium
用来模拟浏览器操作phantomjs
也可以模拟浏览器操作,但是取消了可视化界面
爬虫学习记录
urllib
和requests
都可以用来获取html页面内容,可以使用正则表达式进行解析beautiful soup
是方便解析html的工具,替代正则表达式selenium
用来模拟浏览器操作phantomjs
也可以模拟浏览器操作,但是取消了可视化界面爬虫学习记录