本项目为爬虫和ES6学习项目,主要难度是针对反爬虫。
正常使用步骤:
- 请先安装mongodb(根据操作系统下载安装包进行安装)和依赖包(npm install)
- 按照下文说明添加配置文件config.js,如proxys、cookies
- 利用将代码编译成ES5代码:npm run deploy
- 初次使用或需重置数据库请执行:npm run init
- 连续爬取数据执行:npm run once
其他可用命令:
- npm run test //测试一些策略是否有效
- npm run watch //开发使用
- npm run fetch [url] //根据链接获取html并保存本地