jasonren0403 / news_hotspot_crawler

基于scrapy的中国国内各大新闻网站内容爬虫

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

news_hotspot_crawler

基于scrapy的国内各大新闻网站内容爬虫
入口文件还未编写,请进入hotspot_crawler文件夹中,运行
scrapy crawl 爬虫名
以开始爬虫过程,爬虫结果将保存在news_items文件夹中,日志将保存在hotspot_crawler/logs文件夹中

About

基于scrapy的中国国内各大新闻网站内容爬虫

License:GNU General Public License v3.0


Languages

Language:Python 100.0%