felipedoamarals / TeoMeLab

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

Téo Me Lab

Seja bem vindo à nossa trilha de Data Science na nuvem! Vamos aprender a usar tecnlogias do mercado de trabalho nesta nova jornada! Espero que se divirta e aprenda conosco.

Objetivo

Em todas nossas iniciativas e projetos, buscamos democratizar o conhecimento com qualidade e de forma gratuíta. Ainda, provendo a experiência de discussões a respeito de problemas reais e aplicações práticas.

Desta vez montamos um ambiente de computação em nuvem para desbravar este novo mundo. Desejamos ao final deste projeto ter um modelo de Machine Learning treinado e realizando predições em um ambiente "Big Data", percorrendo todas as etapas do ciclo analítico.

Os dados que possibilitarão este desenvolvimento são proveninetes da empresa Olist, uma startup no segmento de e-commerce Para ter acesso aos dados, basta clicar aqui.

Durante todo desenvolvimento estaremos focados no seller, principal cliente da empresa. Isto é, sob o prisma de CRM ou Customer Success desejamos traçar indicadores, descoberta de perfis, segmentações e aplicações de modelos preditivos para nossos vendedores. Tudo isso para melhorar a performance destes em suas vendas online.

Ambiente

Utilizaremos o Databricks para realizar todo o processamento de dados no que diz respeito à ETL e manipulações massivas, em que o mesmo está plugado em um Data Lake (Blob Storage Gen2) na Azure.

Pré-requisitos

Buscamos trazer todos para a mesma página em nossos encontros. Entretanto, aqueles que já tem contato com SQL e Python terão maior facilidade em acompanhar.

Garanto com que certa dose de força de vontade e ânimo, qualquer pessoa poderá absorver o conhecimento que desejamos transmitir.

É Sub na Twitch?

Caso você seja um inscrito 3+ meses em nosso canal da Twitch, poderá usufruir deste ambiente. Basta enviar um susurro pela Twitch com seu email pessoal. Deixamos claro que isso não é uma compra, mas sim um reconhecimento pelo engajamento de nossos seguidores e apoiadores.

Cronograma

Episódio Dia Tema
1 08/09 O ambiente e as primeiras variáveis
2 10/09 Book de variáveis para Seller - Parte I
3 15/09 Book de variáveis para Seller - Parte II
4 17/09 Book de variáveis para Produto
5 22/09 Criação da ABT - Parte I
6 24/09 Criação da ABT - Parte II
7 29/09 Treinando algoritmos de Classificação
8 01/10 Comparando diversos modelos
9 06/10 Deploy

About