Este notebook contém um "Tutorial" de como pontuar 0.79425 no kaggle com o dataset titanic. O kaggle é um site de competição relacionado a dados, e o dataset é um hello-world no mundo dos "Kagglers" e também dos dados.
O notebook está divído em 3 partes, que são:
- Análise de dados
- Feature engineering e limpeza de dados
- Criação de modelos e previsões
Como este é meu primeiro contato com o mundo de competições e dados, portanto é um tutorial bem simples e pode conter alguns erros ou soluções não tão boas assim.
Site da competição: https://www.kaggle.com/c/titanic