joaoboger / TechnicalChallenge-ChurnPrediction

O presente estudo é motivado pelo desafio técnico fornecido pela Indicium para a vaga de Cientista de Dados.

Projeto de Previsão de Churn

Este repositório contém código e arquivos relacionados ao projeto de previsão de churn para uma instituição financeira.

Notebooks

O diretório notebooks contém Jupyter notebooks para análise exploratória de dados (EDA) e desenvolvimento de modelos de aprendizado de máquina.

churn_eda_ml.ipynb: Notebook para EDA e desenvolvimento de modelos de ML.

Pipeline

O diretório pipeline contém scripts e arquivos relacionados ao pipeline de previsão de churn.

churn_pipeline.py: Script Python para executar o pipeline de previsão de churn e fazer previsões em novos dados.

Dataset

O diretório data armazena o conjunto de dados usado para a previsão de churn.

Uso

Clone o repositório:

git clone https://github.com/joaoboger/TechnicalChallenge-ChurnPrediction

Prepare os dados de entrada:
- Renomeie o arquivo de dados desejado a ser previsto como Abandono_teste.csv.
- Mova o arquivo Abandono_teste.csv para o diretório data dentro do repositório.
- Instale as dependências necessárias executando o seguinte comando para instalar a versão específica das bibliotecas, certifique-se de ter o Python instalado (versão 3.9.13):

pip install -r requirements.txt

Execute o pipeline de previsão de churn:
- Abra um terminal ou prompt de comando e navegue até o diretório raiz do repositório clonado.
- Execute o seguinte comando para executar o script churn_pipeline.py:

python pipeline/churn_pipeline.py

Verifique as previsões de saída:
- Após a execução do script, os resultados de churn previstos serão gerados.
- Localize o arquivo de previsões de saída chamado predictions.csv.
- Encontre o arquivo predictions.csv no diretório output dentro do repositório.
- O arquivo terá duas colunas: a primeira coluna representa os números das linhas, e a segunda coluna contém os valores previstos de churn.

About

O presente estudo é motivado pelo desafio técnico fornecido pela Indicium para a vaga de Cientista de Dados.

Languages

Language:Jupyter Notebook 100.0%Language:Python 0.0%