anaelisaq / etl-service

Primeiro serviço em Python, desenvolvimento de um processo de etl

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

Teste Técnico - Neoway

Desenvolvimento back-end de um serviço de ETL na linguagem Python

O propósito desse serviço é ler o arquivo base_teste.txt e realizar validações dos dados contidos nas colunas de CPF e CNPJ. Após o tratamento dos dados, eles são armazenados no banco de dados PostgreSQL usando Docker.

Para executar esse serviço, siga os passos abaixo:

  1. Instale o Docker Desktop em sua máquina (caso ainda não tenha):
  1. Clonar o repositório e colar no terminal o seguinte comando:
git clone git@github.com:anaelisaq/etl-service.git
  1. Executar o Docker Compose pelo terminal:
docker-compose up -d
  1. Em seguida, executar o comando no terminal para inicializr o serviço:
docker-compose run app

Para realização desse desenvolvimento, foram utilizadas as seguintes referências:

Estrutura relacional do projeto

A partir desse serviço, será criada uma tabela chamada dbneoway e está armazenada de modo público no PostgreSQL, seguindo a estrutura relacional:

Column name Data Type
CPF VARCHAR
PRIVATE INTEGER
INCOMPLETO INTEGER
DATA_DA_ULTIMA_COMPRA DATE
TICKET_MEDIO FLOAT
TICKET_DA_ULTIMA_COMPRA FLOAT
LOJA_MAIS_FREQUENTE VARCHAR
LOJA_DA_ULTIMA_COMPRA VARCHAR
CPF_VALIDO VARCHAR
CNPJ_LOJA_MAIS_FREQUENTE_VALIDO VARCHAR
CNPJ_LOJA_DA_ULTIMA_COMPRA_VALIDO VARCHAR

About

Primeiro serviço em Python, desenvolvimento de um processo de etl


Languages

Language:Python 89.4%Language:Dockerfile 10.6%