scrapy startproject myfirst 建立一个工程名为myfirst
cd myfirst 切换到该工程目录下
scrapy genspider mcbqb mc.163.com 建立一个爬虫,名为mcbqb,爬取mcbqb mc.163.com
配置itrms.py
配置spiders/mcbqb.py文件,修改对返回页面的处理,修改对新增URL爬取请求的处理
配置pipelines.py文件,定义对爬取项(Scraped Item)的处理类
配置settings.py文件,配置ITEM_PIPELINES选项
scrapy crawl mcbqb