EddOselotl / sentiment_analysis_tweets

Proyecto de análisis de sentimientos en tweets.

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

Análisis de sentimientos en Tweets


Objetivo

El objetivo de este trabajo es construir un clasificador que aprenda a distinguir entre tweets positivos o negativos.

Datos

Los datos que utilizaremos fueron datos recolectados de twitter acerca del Huracán Harvey y tweets con intención negativa o seria.

  • Fuente: Referencia 1, Referencia 2.

  • Número observaciones: 1,600,000.

  • Variables:

    • target: Polaridad del tweet, positivo o negativo.
    • ids: ID tweet.
    • date: Fecha y hora del tweet.
    • flag: Si hubo algún tipo de QUERY.
    • user: Usuario del tweet
    • text: Texto del tweet.
  • La variable que utilizaremos para entrenar es text, y como etiqueta target.

Limpieza de texto

Para instalar nuestro paquete de limpieza de tweets:

pip install "git+https://github.com/ElenaVillano/sentiment_analysis_tweets.git#egg=nlptweet&subdirectory=src"

Modelos

El código lo puedes observar en la carpeta de notebooks, que viene desde la implementación de la limpieza, hasta ejemplos de los mejores modelos.

Algunas referencias:

Requerimientos


Utilizaremos python y por ahora nuestros notebooks serán probados en Google Colab.

About

Proyecto de análisis de sentimientos en tweets.


Languages

Language:Jupyter Notebook 91.6%Language:TeX 8.2%Language:Python 0.2%