Thinking80s / chrome-crawler

Chrome 插件版博客爬虫，支持自定义数据源 —— A chrome extension for daily reading

chrome-crawler

说明

一个简单的 chrome extension，抓取常看的博客
基于 ajax 请求 + jQury DOM parse
创意来自 whxaxes 的 node-test 项目
为避免浪费请求，应用已经做了 10min 的缓存，如需刷新可以到点击页面提供的刷新按钮
页面加载时会有 1 s 的延时，避免在 new tab 的情况下用户只是想输入新的地址

使用

下载代码并解压
在扩展程序管理界面中选中 开发者模式
点击 加载已解压的扩展程序... 按钮，选择代码所在文件夹
打开方法1：点击图标 OR 点击扩展程序下的 选项 链接
打开方法2：找到扩展程序的 ID，地址栏中打开 chrome-extension://{your_extension_id}/index.html（可以加入到你的书签）
打开方法3：override 你的 new tab 页：将manifest.json中的"options_page": "index.html"替换成下面代码之后再安装 ——
```
    "chrome_url_overrides": {
         "newtab": "index.html"
    }
```
添加自己喜欢的网页：修改 ./js/source.js OR 点击页面上的“+”按钮填写对应的网址及选择器，也支持添加 rss XML 页面。

rss 页面添加

内容	值示例	备注
单列选择器	rss.channel.entry	`.` 分隔父子层级
内容选择器	title	使用标签名
属性选择器	link.$href	使用标签属性

Todo

~~添加自定义页面~~
~~自定义数据来源~~
代码重构
修改编辑数据源
添加更加完备的日期格式化（选择器、正则匹配）

如有问题，欢迎与我联系：

About

Chrome 插件版博客爬虫，支持自定义数据源 —— A chrome extension for daily reading

MIT License

Languages

Language:JavaScript 70.9%Language:CSS 24.0%Language:HTML 5.1%