保存一些学习python爬虫过程中的代码片段
一、dytt_spider.py
介绍:这是一个基本完成的爬电影天堂的最新电影列表及详情页的爬虫;
遗留问题:1、需要增加在连接失败的情况下重新发送请求的代码;2、excel或其他方式保留
网址:http://www.dytt8.net/html/gndy/dyzz/list_23_1.html
二、sina.py
介绍:这是一个基本完成的爬新浪国内新闻列表的爬虫。
网址:https://news.sina.com.cn/china/
三、tencentJob_spider
介绍:Tencent招聘网页上的信息获取,基本功能已经实现
网址:https://hr.tencent.com/position.php?&start=0#a
四、weatherChina
介绍:获取**天气网中,全国城市地区一天的最低气温,并做前十位的可视化