LeonardoRussoIT / ETL_com_spark

Projeto de engenharia de dados utilizando Spark na plataforma Azure Databricks

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

Projeto de Engenharia de Dados para Classificação de Preços

Este projeto foi realizado no Azure Databricks e tem como objetivo preparar os dados em formato JSON para serem utilizados pela equipe de engenheiros de Machine Learning na criação de um modelo de classificação de preços.

Descrição do Projeto

O objetivo deste projeto é realizar as seguintes etapas:

  1. Coleta de Dados: Coletar os dados em formato JSON.
  2. Análise e Limpeza de Dados: Realizar uma análise inicial dos dados e limpar quaisquer dados ausentes, inconsistentes ou irrelevantes.
  3. Transformação de Dados: Transformar os dados JSON em um formato adequado para a construção do modelo de ML.
  4. Entrega dos Dados: Entregar os conjuntos de dados tratados à equipe de engenheiros de ML para a construção do modelo de classificação de preços.

About

Projeto de engenharia de dados utilizando Spark na plataforma Azure Databricks


Languages

Language:Jupyter Notebook 100.0%