whusnoopy / renrenBackup

A backup tool for renren.com

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

请问后续还有什么更新计划吗?

fisheepx opened this issue · comments

之前感觉腾讯微博要over,
自己写了一个腾讯微博备份工具(见我的Git),
由于微博比较简单,所以干脆就用selenium备份到了word里面,
然后把腾讯微博注销了。

最近想把人人也注销掉,本来想自己写个备份工具,
结果搜了下git发现竟然有这么好用的备份工具,
刚才备份成功后显示效果也非常不错。
但是不知道目前这个工具的备份功能还有什么后续更新计划吗?
(看到TODO里面的LIST应该不是备份功能)
如果没有的话我就干脆注销掉人人账号了。
(如果有更新或者此版本有备份不全的话注销了就没办法再备一次了😂)

最后感谢这么好用的工具!👍👍👍

最近应该没有太多爬取的更新计划,长期来看还是会希望抓到如下内容

  1. 分享。包括分享的赞和评论。现在分享没看到合适的 json 接口,只能解析页面,而且分享的类型太多,解析和还原比较麻烦
  2. 全部赞的数据。目前的接口只返回了 8 个具体的点赞人,回头看看能不能拿到全量
  3. 部分要抓到本地的图。看起来日志里的图是没有抓到本地或没有做转换(不确定日志里的图会不会在相册里存在)
  4. 短链接的转化。看起来抓到的短链里 a 标签都带了 title 是对应的原链接,不过这个应该不依赖抓取,本地数据可以直接转
  5. 其他人的数据抓取。这个需要改下 db 结构,把 uid 信息也加进去

事实上,我觉得注销只是不给别人看的一个途径吧,数据还是在对方的 db 里,不会释放掉的

分享的内容确实是URL控制换页的,
但大多已经处于无法打开了状态了,
毕竟多年过去了,估计也没那么重要了。
日志的图在相册里应该是不存在的。

数据估计肯定是不会物理删除的吧,顶多是个delete flg,
在注销账号的时候发现竟然还可以暂时停用账号,
反正也不会server端删除,就先停用算了。

程序里的ORM框架和Flask受教了,感谢。