zhihu-collection
知乎离线收藏夹
简介
能够帮你抓取知乎中的收藏夹, 专栏, 回答. 收藏夹和专栏可以整体抓取, 也可以抓取单独的收藏夹和专栏文章, 单独的答案抓取会被归类到名人堂专栏 使用Express + Mongodb + Node.js
使用
1. 启动mongodb
2. 调用lib的接口进行抓取, 抓取的结果会保存在mongodb中, 具体例子可以看example.js
3. node worker.js 启动服务器进程, 通过http://localhost:3000 进行浏览
注意
由于知乎有些收藏夹需要登录才能浏览, 你可以在lib/uitl.js中设置Cookie, 然后进行抓取, 默认是没有设置Cookie的
Done
- 模仿Node.js API 布局
- 调整答案图片大小
- 添加作者链接
- 答案点击跳转
- 选中链接加下划线
- 加入专栏分栏, 收缩列表
- 返回顶部按钮
- 测试收藏夹一个问题, 有多个答案的情况
- 除了第一个答案, 之后没有标题
- 防止答案删除功能
- 获取编辑时间
- 抓取分页
- 名人堂分栏
Todo
- 在线抓取
License
MIT