Applying linear regression to forecast potential crime occurrences in the state of Maryland, United States.
In this project, I am utilizing exploratory data analysis (EDA) in conjunction with linear regression technique to make predictions about potential crime occurrences in the state of Maryland, United States.
Nesse projeto, estou utilizando a análise exploratória de dados (EDA) em conjunto com a técnica de regressão linear para realizar previsões sobre possÃveis ocorrências de crimes no estado de Maryland, nos Estados Unidos.
-
Exploratory Data Analysis (EDA)
- Statistics:
- Mean (Média)
- Median (Mediana)
- Mode (Moda)
- Standard Deviation (Desvio Padrão)
- Total Range and Interquartile Range (Amplitude Total e Diferença Interquartil)
- Skewness (Assimetria)
- Kurtosis (Kurtosis)
- Correlation (Correlação)
- Univariate Analysis (Análise Univariada)
- Bivariate Analysis (Análise Bivariada)
- Multivariate Analysis (Análise Multivariada)
- Numerical Data (Dados Numéricos)
- Categorical Data (Dados Categóricos)
- Sampling Techniques (Técnicas de Amostragem)
- GroupBy (GroupBy)
- Visualization with Seaborn and Folium (Gráficos com Seaborn e Folium)
- Statistics:
-
Preprocessing (Pré-processamento):
- Data Cleaning (Limpeza dos dados)
- Data Rescaling (Reescala dos dados):
- Normalization (Normalização)
- Standardization (Padronização)
- Label Encoder and One-Hot Encoder (Label Encoder e One-Hot Encoder)
- K-Fold Cross Validation from sklearn (K-Fold Cross Validation do sklearn)
- Train Test Split (Divisão de treino e teste)
-
Model Training (Treinamento do Modelo): Using Linear Regression as the machine learning algorithm (Utilização da Regressão Linear como algoritmo de aprendizado de máquina)
-
Model Evaluation (Avaliação do Modelo): Utilizing the following metrics (Utilização das métricas):
- mean_squared_error (Erro Quadrático Médio)
- mean_absolute_error (Erro Absoluto Médio)
- Dataset Link: Crime Data from 2020 to Present
- Notebook -> Crime