This project implements an end-to-end tech stack for a data platform

follow Data Lake-House architecture, there are main interfaces of this platform:

First run:

Change the variable IS_RESUME in ./services/metastore/docker-compose.yml to False
Grant all permissions for HDFS

sudo mkdir -p ./services/hadoop/data
sudo chmod  777 ./services/hadoop/data/*

After finishing all the above steps, change IS_RESUME back to True then rerun start all service

This project implements an end-to-end techstack for a data platform, can be used on production.

Language:Python 82.9%Language:TSQL 12.4%Language:Shell 3.8%Language:Dockerfile 0.8%