Neste repositório está meu primeiro trabalho simples e pessoal de aplicação do modelo regressão Linear em Python para uso em Ciencia de dados.
O trabalho tem os passos abaixo:
-
Importação das bibliotecas pertinentes e dados para iniciar o trabalho;
-
Análise inicial com shape, head e boxplot a fim de verificar outliers, visto que estes interferem na aplicação do modelo;
-
Substituição dos outliers pela mediana como opção pessoal, visto que existe pouca amostragem de dados;
-
Criação das variáveis X e Y;
-
Cálculo de correlação (que deu forte);
-
Aplicação do modelo;
-
Cálculos da intersecção (X=0) com reta Y e inclinação da reta;
-
Criação do gráfico do modelo e resíduos;
-
Predição de um valor informado.