Tulioteodoro / credit_card

Data Processing

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

CREDIT CARD

Utilizando fonte de dados do kaggle para trabalhar conceitos de extração, manipulação e tratamento de dados (outliers).

Fonte dos dados: kaggle.com/arjunbhasin2013/ccdata

Bibliotecas utilizadas no estudo proposto:

  • pandas
  • numpy
  • seaborn

Além disso, utilizei a normalização Stantard Scaler sobre as variáveis numéricas para posteriormente clusterizar os dados utilizando o K-Means e assim, disponibilizar uma visualização gráfica sobre eles. Os dados foram agrupados em novas colunas, CLUSTER_K2 e CLUSTER_K3.

About

Data Processing


Languages

Language:Jupyter Notebook 100.0%