doubanBook

主要用于抓取豆瓣图书，基于Scrapy框架

##特性: 加入UserAgentMiddleware和RandomProxyMiddleware实现每次抓取时自动切换请求头和ip防止被屏蔽

##环境说明： Python 2.7 Scrapy 1.10

##使用方法：

##一些配置选项：

默认抓取的是豆瓣图书关于历史的图书豆瓣图书历史类,想要抓取全站可以在doubanBookSpider.py中start_urls =[]中设置更多初始网址豆瓣图书热门标签
默认不开启代理IP中间件，如需开启可在setting.py中DOWNLOADER_MIDDLEWARES开启
代理ip默认使用文件，可在setting.py中PROXY_LIST设置代理文件位置，支持以下格式

 http://host1:port
 http://username:password@host2:port
 host3:port

YangShuqing / doubanBook