cangkongman / crawling-bilibili-personal-collect

爬取bilibili的自己账号的收藏夹信息,并且json转excel储存,免得B站删视频的时候收藏夹里的已失效视频不知道是什么。

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

爬取bilibili的自己账号的收藏夹信息,并且json转excel存储

防止自己收藏夹什么视频被删都不知道

源文件下载下来有三点需要注意

1.UID要改。改成自己的

2.收藏夹要公开

3.路径注意一下。

功能及其实现思路

爬取收藏夹信息

1.先爬取所有收藏夹的id

2.通过爬取的收藏夹的id,再爬取各个收藏夹的每一页(一页最多20个视频)

3.再稍微整理,得到每个收藏夹的json文件

爬取视频封面和up主头像

1.从上一步的json文件中,提取出图片url

2.多线程爬取图片url

可视化

写入excel 大概如下图所示,不过上次没失效,而这次失效的视频会在右下角标记出来。

微信图片_20220412201348

About

爬取bilibili的自己账号的收藏夹信息,并且json转excel储存,免得B站删视频的时候收藏夹里的已失效视频不知道是什么。


Languages

Language:Python 100.0%