豆瓣相册爬取器

###运行前提：

python版本为2.7x
需要配置好scrapy环境

###食用方法：

####1.设置要下载的页面id和页数: 修改...\douban-image-scrapy\DownloadImage\DownloadImage\spiders的DownloadImage.py,找到MovieId = [....]处，这里每个元素是一个1×2数组,其中数组第一个元素是电影/动画在豆瓣上的id，第二个元素是该电影/动画相册的页数。

比如想要爬取《反叛的鲁路修》和《钢之炼金术师》的相册，其中鲁鲁修的地址是，http://movie.douban.com/subject/2043155/,而钢炼的是http://movie.douban.com/subject/1433342/，然后再看他们的相册，比如鲁鲁修的相册有2页，而钢炼的相册地址有4页，所以应该填写的是:

MovieId = [[2043155,2],[2043155,4]]

修改后保存即可！

####2.获取下载链接并自动下载

cd .\DownloadImage
scrapy crawl downloadspider

等运行完毕，即可在...\douban-image-scrapy\DownloadImage\Image下找到图片

###后期改进：有空的话。。。

自动检测电影相册页数，只要输入id即可
图片按电影分好类

leo007008 / douban-image-scrapy

豆瓣相册爬取器

About

Languages