crowphy / crawler

爬虫 获取一个站点的指定内容

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

crawler

爬虫 获取一个站点的指定内容

运行

node app

操作步骤

第一步:输入正确的入口 URL

第二步:输入过滤页面中 URL 的正则表达式

第三步:输入要匹配的内容正则表达式

说明

包含指定内容的 url 将会写入到 links.txt 文件里

About

爬虫 获取一个站点的指定内容

License:Apache License 2.0


Languages

Language:JavaScript 86.3%Language:HTML 13.7%