Red626 / jingyouSpider

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

miguSpider

Node version MongoDB

本项目为爬虫和ES6学习项目,主要难度是针对反爬虫。

参考代码规范:https://github.com/iv-web/javascript


正常使用步骤

  1. 请先安装mongodb(根据操作系统下载安装包进行安装)和依赖包(npm install)
  2. 按照下文说明添加配置文件config.js,如proxys、cookies
  3. 利用将代码编译成ES5代码:npm run deploy
  4. 初次使用或需重置数据库请执行:npm run init
  5. 连续爬取数据执行:npm run once

其他可用命令:

  • npm run test //测试一些策略是否有效
  • npm run watch //开发使用
  • npm run fetch [url] //根据链接获取html并保存本地

About


Languages

Language:JavaScript 100.0%