Este mini projeto é referente ao capítulo 06 chamado de "Big Data na prática 4", referente ao curso Big Data Analytics with R e Microsoft Azure Machine Learning na Data Science Academy.
A rotatividade (churn) de clientes ocorre quando clientes ou assinantes param de fazer negócios com uma empresa ou serviço. Também é conhecido como perda de clientes ou taxa de cancelamento.
Um setor no qual saber e prever as taxas de cancelamento é particularmente útil é o setor de telecomunicações, porque a maioria dos clientes tem várias opções de escolha dentro de uma localização geográfica.
Neste projeto, vamos prever a rotatividade (churn) de clientes usando um conjunto de dados de telecomunicações. Usaremos a regressão logística, a árvore de decisão e a floresta aleatória como modelos de Machine Learning.
Usaremos um dataset oferecido gratuitamente no portal IBM Sample Data Sets. Cada linha representa um cliente e cada coluna contém os atributos desse cliente.
Link: https://www.ibm.com/communities/analytics/watson-analytics-blog/guide-to-sample-datasets/