wenke727 / weibo-search

获取微博搜索结果信息,搜索即可以是微博关键词搜索,也可以是微博话题搜索

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

微博

搜索正文中包含指定关键词的微博 其中关键词位于weibo/settings.py KEYWORD_LIST

数据获取

操作说明

  1. 获取cookie https://weibo.com/ -> F12 -> coockie

  2. 修改setting配置 weibo/settings.py: KEYWORD_LIST, START_DATE, END_DATE

  3. 启动爬虫

    conda activate weibo
    sh run.sh
  4. 输出 ./result, 以关键词划分

抓取情况

计划爬取16年以后的数据,共5.5年

  • 2021-01-01 ~ 2021-07-03
  • 2020-01-01 ~ 2020-12-31
  • 2019-01-01 ~ 2019-12-31
  • 2018-01-01 ~ 2018-12-31
  • 2017-01-01 ~ 2017-12-31
  • 2016-01-01 ~ 2016-12-31

Ref

NLP处理

Ref

About

获取微博搜索结果信息,搜索即可以是微博关键词搜索,也可以是微博话题搜索


Languages

Language:Python 99.6%Language:Shell 0.4%