hamburgersct / tweet_analysis

sentiment analysis of tweets during COVID-19

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

tweet_analysis

数据来源

https://github.com/echen102/COVID-19-TweetIDs

Notes!

  • 推荐使用anaconda创建虚拟环境
  • 首先运行pip install -r requirements.txtconda install --yes --file requirements.txt
  • 使用conda安装conda install -c plotly plotly-orca
  • 要在项目所在文件位置建立./tweets文件夹用来存储所有的tweet json(命名格式为coronavirus-tweet-id-2020-01-21-23.json)
  • 然后运行launch.py

当前状态

  • 英文分词
  • ngram分析及图表
  • 英文LIWC
  • 其他语言
  • 地理特征分析

输出文件

  • ./tweet_result存放由tweet json转换而来的csv文件
  • ./tweet_per_day存放每日的tweet csv汇总
  • ./clean_en_tweet把csv中clean_text写入文件,每条一行(用来做LIWC)
  • ./tokenize_en_result分词处理后的文本写入
  • ./bi(tri)_gram_folder存储每日bgram、trigram分析结果
  • ./bi(tri)_images存储每日的2/3gram图像

About

sentiment analysis of tweets during COVID-19


Languages

Language:Jupyter Notebook 97.4%Language:Python 2.6%