备份新浪微博指定用户的全部微博,文本数据保存到redis数据库文件,图片文件保存到仓库的文件夹下,并以markdown格式输出到json。
git clone https://github.com/shaoyaoqian/weibo-shaoyaoqian.git
cd weibo-shaoyaoqian
pip install requirements.txt
- 删除
main
分支中的dump.rdb
文件,创建output
分支 - 在
.github/workflows/main.yml
中设置微博IDWEIBO_USER
- 在
weibospider/cookie.txt
中设置 cookies - 将代码 push 到 GitHub 仓库,开启 GitHub Action
- 默认只下载最新的25条微博,如需下载所有微博,注释
weibospider/settings.py
代码中的DEPTH_LIMIT = 1
- 设置 vercel 反向代理加速图片文件加载,修改
output/convert.py
中的代码pic_cdn_url_base
和pic_original_cdn_url_base
变量 - 将微博内容添加到博客中
PRs accepted.
MIT
- 爬取视频