基于关键词搜索结果的微博爬虫,主要按天抓取了博主昵称、博主主页、微博内容、微博地址、发布时间、发布来源、转发、评论、赞9项。
主要实现分时爬取。原来的代码时间间隔是天,做部分修改,新增代码时间做到了小时为间隔
使用selenium
进行数据抓取的代码
使用模拟登录的代码,多天的数据保存在一个sheet里
基于关键词搜索结果的微博爬虫
基于关键词搜索结果的微博爬虫,主要按天抓取了博主昵称、博主主页、微博内容、微博地址、发布时间、发布来源、转发、评论、赞9项。
主要实现分时爬取。原来的代码时间间隔是天,做部分修改,新增代码时间做到了小时为间隔
使用selenium
进行数据抓取的代码
使用模拟登录的代码,多天的数据保存在一个sheet里
基于关键词搜索结果的微博爬虫
GNU General Public License v3.0