MeituanSpider

美团爬虫，基于scrapy_redis,学习使用，请勿用于商业用途。（目前实现板块：美食板块）

美食板块

根据地点爬取美食板块所有商家信息，保存至mongoDB数据库

其他设置请参考scrapy官方文档。

python (3.6.3)
Scrapy (1.5.1)
scrapy-redis (0.6.8)
pymongo (3.7.1)

首次启动需要向 redis_key 中传入起始 url

redis 数据库中：

select 0
lpush meishi_start_urls https://meishi.meituan.com/i/?ci=45&stid_b=1&cevent=imt/homepage/category1/1

终端运行爬虫：

scrapy crawl meishi

保存的信息分为两大块：商家信息和评论信息。

评论信息默认不爬取（分布式可以开启，本人就一台电脑，速度太慢- -），如需开启爬取评论信息功能将相关代码注释取消即可。
爬取过程中可能出现验证码。

目前处理方式为手动验证：
- 验证码出现后程序暂停20秒，打开出现验证码的url，手动输入验证
有条件的话建议处理方式：
- 接入打码平台
- 使用代理