a289237642 / baozang_index

爬取B站弹幕,生成词云

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

宝藏值

GitHub stars GitHub license

因为经常打开一个动漫就有一大堆人刷宝藏动漫,就像这个样子

我就想,既然这么多番都很宝藏,到底哪个更宝藏?所以我就写了个爬虫把弹幕爬下来,看看到底有多少个宝藏,然后顺便添加了一个词云的功能。

第三方库

  • jieba
  • wordcloud
  • lxml

用法

直接运行程序,输入网址和视频的oid,oid号应该是B站视频的唯一编码,按f12找到list.so文件,后面带的就是oid。

词云展示

About

爬取B站弹幕,生成词云

License:MIT License


Languages

Language:Python 100.0%