robsonjr103 / data_engineer_portfolio

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

Meu portfolio de projetos de Engenharia de Dados

Nesse repositório estão armazenados todos os meus projetos desenvolvidos na minha jornada para me tornar um Engenheiro de Dados.

Uma breve explicação de cada projeto:

Análise do conjunto de dados da empresa ficticia House Rocket (house_rocket_analysis):

Nesse projeto eu faço uma análise no conjunto de dados com mais de 21.000 casas disponíveis para compra da empresa ficticia House Rocket, que trabalha com a compra e re-venda de casas. Eu repondo 4 perguntas principais do "CEO" da House Rocket, como: "Quais casas deveriamos comprar?", "Qual o melhor preço para re-venda e quando vende-las?", "Vale a pena reformar as casas antes de vende-las?". Além disso também há uma Aplicação Web que pode ser vista no navegador, ela contém os principais Insights da análise, uma tabela contendo quais casas comprar, por qual preço vende-las se elas forem reformadas ou não, além do possível lucro. Além disso também há dois mapas mostrando onde as casas se localizam e o preço médio das casas por região (ZipCode).


Atualização diária de dados do Covid no Brazil e nos seus estados (covid_daily_update):

Essa aplicação roda dentro de um container com os serviços do Airflow, Redis e Postgres. Por meio do Script "run.py", duas tabelas dentro de um Banco de dados do gerenciado pelo Postgres, uma tabela contém dados diários e gerais do Covid-19 no Brasil, a outra tabela contém dados diários de cada estado brasileiro, por fim o script faz multiplas requisições na API covid-api para que todos os dados diários disponíveis para cada tabela sejam inseridos dentro das mesmas. Além disso há a DAG do Airflow chamada "daily_update_covid_tables" que insere diariamente as UTC 13h01 dados de dia anterior para cada tabela de forma automatica.


Projeto Flask (flask_project):

É uma aplicação que adiciona, edita e deleta uma lista de tarefas pelo mini-framework Flask, em Python, juntamente com um Banco de Dados gerenciado pelo PostgreSQL. Na interface web nós podemos manipular o Banco de Dados para adiconar tarefas, altera-las e remove-las. É uma aplicação simples, em que o foco não é a aplicação web, mas sim entender conceitos de API, como rotas, portas, verbos e códigos HTTP, entre outros, assim como criar um Banco de Dados para uma aplicação.


About

License:MIT License


Languages

Language:Jupyter Notebook 99.4%Language:Python 0.5%Language:HTML 0.0%Language:Shell 0.0%Language:CSS 0.0%