shaoyaoqian / weibo

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

微博备份

备份新浪微博指定用户的全部微博,文本数据保存到redis数据库文件,图片文件保存到仓库的文件夹下,并以markdown格式输出到json。

安装

git clone https://github.com/shaoyaoqian/weibo-shaoyaoqian.git
cd weibo-shaoyaoqian
pip install requirements.txt

使用

  1. 删除 main 分支中的 dump.rdb 文件,创建 output 分支
  2. .github/workflows/main.yml 中设置微博ID WEIBO_USER
  3. weibospider/cookie.txt 中设置 cookies
  4. 将代码 push 到 GitHub 仓库,开启 GitHub Action

可选设置

  1. 默认只下载最新的25条微博,如需下载所有微博,注释 weibospider/settings.py 代码中的 DEPTH_LIMIT = 1
  2. 设置 vercel 反向代理加速图片文件加载,修改 output/convert.py 中的代码 pic_cdn_url_basepic_original_cdn_url_base 变量
  3. 将微博内容添加到博客中

效果展示

(随便找的微博账号) image image image image image

移动端

4721673065737_.pic

4681673065735_.pic

4701673065736_.pic

4711673065737_.pic

Contributing

PRs accepted.

License

MIT

代码及作者

WeiboSpider

shaoyaoqian

readme模板

TODO

  1. 爬取视频

About


Languages

Language:Python 100.0%