LucasPereiraMiranda / sentiment-detection-with-sentistrength

Repository to study and use the Sentistrength algorithm for sentiment analysis in the Brazilian Portuguese context

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

Análise de sentimentos com SentiStrength

GitHub language count Repository size GitHub last commit Repository Pull Request GitHub license

Repositório para estudar e usar o algoritmo Sentistrength para análise de sentimentos no contexto do português do Brasil.

Techs

A análise está sendo realizada com as seguintes tecnologias:

O que é o Sentistrength?

O Sentistrength é um algoritmo de análise de sentimentos interessante para textos de redes sociais (geralmente curtos e carregados com sentimentos). Ele utiliza um dicionário léxico anotado por seres humanos e melhorado com o uso de Aprendizado de Máquina. O SentiStrength atribui pontuações a tokens de um dicionário, sendo que as palavras com emoções positivas são atribuídos valores entre 1 e 5 e as palavras com emoções negativas são atribuídos valores entre -5 e -1. Os valores 1 e -1 são usados para indicar emoções neutras, enquanto que 5 e -5 são usados para indicar emoções muito positivas e muito negativas, respectivamente. E realizado um cálculo com a polaridade de cada termo com emoção na frase, resultando em scores que indicam o resultado da análise de sentimento.

O sentistrength 0.0.7 oferece alguns scores resultantes da análise de sentimentos de um texto, dentre os principais temos:

  • dual
  • trinary
  • scale

Exemplo:

texto de entrada: 'mesmo com todo o sucesso ela vivia uma vida tediosa'

Scores resultantes:

dual: [(positivo,negativo)] [(4,-3)] positivo em 4 e negativo em -3
trinary: [(positivo,negativo,neutro)] [(4,-3,1)]  positivo em 4, negativo em -3 e neutro em 1
scale: [0.25] escala proporcional ao dual e ao trinary, variando entre 1 (muito positivo) e -1 (muito negativo). O valor 0 representa o neutro.

Como fazer a análise?

Podemos instalar as dependências necessárias no seu ambiente python3 (ou virtualenv)

  • requiriments.txt possui as dependências básicas necessárias para o projeto
  pip3 install -r requirements.txt
  • Podemos executar o seguinte comando para rodar a análise (após setar os paths no script /source/sentistrength_test.py):
  python3 source/sentistrength_test.py

Como podemos criar um ambiente virtual (virtualenv) para o projeto? (opcional)

  • Com o python3 já instalado no computador, podemos executar:
  pip3 install virtualenv
  • Podemos gerar um novo ambiente virtual executando o comando:
  virtualenv venv # venv é o nome do seu ambiente virtual isolado
  • Podemos ativar o ambiente virtual executando:
  source /venv/bin/activate # Linux ou Mac
  venv\Scripts\activate # Windows
  • É possível instalar as dependências no novo ambiente virtual executando:
  pip3 install -r requirements.txt

Resultados dos testes de análise de sentimentos

Results

Referências

About

Repository to study and use the Sentistrength algorithm for sentiment analysis in the Brazilian Portuguese context

License:Creative Commons Zero v1.0 Universal


Languages

Language:Python 100.0%