moderndatastackpipeline / modern-data-stack

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

airbyte-dbt-airflow-snowflake-metabase

Repositório para armazenar os artefatos do Pipeline utilizando Modern Data Stack com AirByte + DBT + Airflow + SnowFlake + Metabase

Tarefas:

Infraestrutura:

  • Setup do ambiente de desenvolvimento (Hardware, Software - Linux, Python, Docker, Curl, Pip, Git, Npm, etc...) X

  • Setar as Permissoes do Gitpod ao Repositorio no Github X

  • Subir o Airbyte via docker X

  • Subir o Airflow via docker X

  • Subir o Metabase via docker X

  • Criar o script de execução ?

  • Testar a Execução ?

  • Snowflake Data Warehouse:

    • Criar a Conta no SnowFlake X
    • Verificar a existência das tabelas X
    • Obter os links de conexão e nome da conta X

Extração:

  • No Airbyte:

    • Conectar com as origens baseadas nos Csvs X
    • Criar as entidades no snowflake através do script base da documentação X
    • Conectar o destino no snowflake X
    • Criar as conexões do airbyte associando as origens ao destino X
    • Testar as conexões X

Preparação:

  • No Airbyte (Destination Loading Method):

    • Local Staging (Ambiente de Desenvolvimento) X
    • Cloud Staging (Ambiente de Produção) X

Transformação:

  • No Dbt:

    • Criação da Conta X
    • Conexão com o Github X
    • Criação do Dbt Project X
    • Criação do Profile de conexão com o snowflake X
    • Criação do Schema X
    • Criação dos Modelos Base X
    • Criação do Modelo Relacionado X
    • Visualização gráfica do modelo X
    • Teste de execução X
    • Commits, Branches, Pull Requests, Merges no Github X
    • Obtenção do link de conexão com o Airbyte X

Visualização:

  • No Metabase:

    • Conectar Metabase com o Snowflake
    • Criar uma Question
    • Criar um Dashboard
    • Adicionar uma Question
    • Visualizar o Resultado

Orquestração:

  • No Airflow:

    • Criar a dag

    • Criar a Docker network

    • Incluir nos composes a network criada

    • Setup Up no serviço

    • Testar a conexao entre os containers do airflow e do airbyte

    • Criar as conexões com o Airbyte através do script

    • Testar a execução do pipeline

Encerramento:

  • Material de Apoio:

    • Links

    • Códigos fonte

    • Apresentação

About


Languages

Language:Shell 41.4%Language:Python 30.9%Language:PLpgSQL 27.8%