请问后续还有什么更新计划吗?
fisheepx opened this issue · comments
fisheepx commented
之前感觉腾讯微博要over,
自己写了一个腾讯微博备份工具(见我的Git),
由于微博比较简单,所以干脆就用selenium备份到了word里面,
然后把腾讯微博注销了。
最近想把人人也注销掉,本来想自己写个备份工具,
结果搜了下git发现竟然有这么好用的备份工具,
刚才备份成功后显示效果也非常不错。
但是不知道目前这个工具的备份功能还有什么后续更新计划吗?
(看到TODO里面的LIST应该不是备份功能)
如果没有的话我就干脆注销掉人人账号了。
(如果有更新或者此版本有备份不全的话注销了就没办法再备一次了😂)
最后感谢这么好用的工具!👍👍👍
Wen YE commented
最近应该没有太多爬取的更新计划,长期来看还是会希望抓到如下内容
- 分享。包括分享的赞和评论。现在分享没看到合适的 json 接口,只能解析页面,而且分享的类型太多,解析和还原比较麻烦
- 全部赞的数据。目前的接口只返回了 8 个具体的点赞人,回头看看能不能拿到全量
- 部分要抓到本地的图。看起来日志里的图是没有抓到本地或没有做转换(不确定日志里的图会不会在相册里存在)
- 短链接的转化。看起来抓到的短链里 a 标签都带了 title 是对应的原链接,不过这个应该不依赖抓取,本地数据可以直接转
- 其他人的数据抓取。这个需要改下 db 结构,把 uid 信息也加进去
事实上,我觉得注销只是不给别人看的一个途径吧,数据还是在对方的 db 里,不会释放掉的
fisheepx commented
分享的内容确实是URL控制换页的,
但大多已经处于无法打开了状态了,
毕竟多年过去了,估计也没那么重要了。
日志的图在相册里应该是不存在的。
数据估计肯定是不会物理删除的吧,顶多是个delete flg,
在注销账号的时候发现竟然还可以暂时停用账号,
反正也不会server端删除,就先停用算了。
程序里的ORM框架和Flask受教了,感谢。