gabrielonishi / xbox-tweets-classifier

Classificador Naive-Bayes para separar comentários relevantes a respeito da marca xbox. Feito como Projeto 1 da disciplina Ciência dos Dados, do 2° semestre de Engenharia da Computação do Insper.

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

Classificador Naive-Bayes de Tweets a Respeito da Marca Xbox

Este repositório contém um projeto de classificação de tweets relacionados à marca Xbox usando técnicas de aprendizado de máquina. O objetivo é criar um modelo capaz de classificar automaticamente tweets como relevantes ou não para a Microsoft. Considerou-se tweets relevantes aqueles com reclamações ou elogios ao produto, informações úteis para a empresa se guiar. Feito como Projeto 1 da disciplina Ciência de Dados, do 2° semestre de Engenharia de Computação do Insper.

Equipe

Descrição

O projeto consiste em coletar um conjunto de tweets que mencionam o Xbox, pré-processar os dados, treinar um modelo de aprendizado de máquina e avaliar sua capacidade de classificar corretamente novos tweets.

A coleta de tweets foi feita pela API oficial do Twitter.

Conteúdo

O repositório contém os seguintes arquivos e diretórios principais:

  • Obtenção de tweets_André e Gabriel.ipynb: um Jupyter Notebook que descreve o pré-processamento dos dados utilizando a API do Tweeter.
  • xbox.xlsx: planilha com tweets coletados pela API em seu estado bruto.
  • xbox_classificado: planilha com os tweets já classificados entre relevantes ou não relevantes.
  • Projeto1_Layout_Classificador.ipynb: um Jupyter Notebook com as etapas para a montagem do classificador

About

Classificador Naive-Bayes para separar comentários relevantes a respeito da marca xbox. Feito como Projeto 1 da disciplina Ciência dos Dados, do 2° semestre de Engenharia da Computação do Insper.


Languages

Language:Jupyter Notebook 100.0%