JPlin/image_crawler

使用环境：

配置params.cfg文件配置图片存放路径：database(默认当前目录的images文件夹)
可以配置的图片网站有 google , flicker , getty , bing
可以配置的项是：图片的大小，图片的上传日期(flicker 支持) ，页面的数量，每页几张图片，图片的格式等等（具体查看params.cfg）
配置keyword.txt文件在文件中列出搜索图片要用的关键字，'#'代表注释掉
当前目录下在 python环境的cmd输入

python Querykeywords.py params.cfg keyword.txt

开始爬取路径并下载图片
4. 当前目录下在 python环境的cmd输入

python app.py

启动简易服务器
5. 根据提示打开网页(localhost:5000)进行图片下载数目查看

爬虫，模块松耦合

Language:Python 67.3%Language:HTML 31.4%Language:CSS 1.3%