franciscodevs / data_engineer_project

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

Proyecto ETL

Objetivos

  • Crear un entorno virtual para instalar las librerias necesarias de Python

  • Usar el dataset Sales Order de Kaggle

  • Realizar un analisis y transformacion de los datos a fin de crear 2 tablas:

    • Tabla de productos con su ID
      • Generar un Product_id en tabla productos y llevar el Product_id a la tabla principal para relacionar con la tabla productos
    • Tabla de direcciones de compra con sus respectivas coordenadas

  • Crear una base de datos PostgreSQL en Docker

  • Guardar las tablas en la base de datos

About