DeepInMind12345 / BiliSpider

开发 bilibili 网站爬虫,大数据分析研究

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

BiliSpider

【本项目孵化自 idea #4

简介

这里是UUPs爬虫主项目组,任何新技术均会首先应用在B站爬虫上。我们的目标是为每位up主的创作之路助力,主要体现在:

  1. 数据获取与管理:利用爬虫技术获取全B站的视频与用户数据,并用维护数据库的方法管理它们,为创作者提供检索服务
  2. 数据筛选与可视化:在海量数据中筛选出有效且感兴趣的信息,并研究将它们可视化的方法,为创作者提供创作素材
  3. 数据分析与科研:根据获取到的有效数据,对B站推广机制,用户习惯等进行研究,为创作者提供推广经验

数据来源

目前已经迁移到本项目Wiki页面

About

开发 bilibili 网站爬虫,大数据分析研究

License:GNU General Public License v3.0


Languages

Language:Jupyter Notebook 66.9%Language:JavaScript 26.9%Language:CSS 3.3%Language:Mathematica 2.5%Language:Python 0.2%Language:C 0.1%Language:HTML 0.1%Language:C++ 0.0%