data-lineage

There are 16 repositories under data-lineage topic.

OpenMetadata
open-metadata / OpenMetadata
OpenMetadata is a unified metadata platform for data discovery, data observability, and data governance powered by a central metadata repository, in-depth column level lineage, and seamless team collaboration.
metadata datadiscovery data-science dataquality data-profiling metadata-management dataengineering data-catalog data-observability dbt data-discovery datacatalog data-contracts data-governance data-lineage data-validation snowflake data-quality data-quality-checks data-collaboration
Language:TypeScript 5274
elementary
elementary-data / elementary
The dbt-native data observability solution for data & analytics engineers. Monitor your data pipelines in minutes. Available as self-hosted or cloud service with premium features.
data-lineage data-governance data-warehouse snowflake bigquery data-analysis data-pipelines data-pipeline lineage data-reliability data-observability dataops dbt dbt-packages analytics-engineer dbt-artifacts redshift
Language:HTML 1895
MarquezProject / marquez
Collect, aggregate, and visualize a data ecosystem's metadata
data-dictionary data-discovery data-ecosystem-metadata data-governance data-lineage data-ops data-provenance marquez metadata metadata-service
Language:Java 1741
reata / sqllineage
SQL Lineage Analysis Tool powered by Python
data-discovery data-governance data-lineage lineage metadata sql
Language:Python 1297
odd-platform
opendatadiscovery / odd-platform
First open-source data discovery and observability platform. We make a life for data practitioners easy so you can focus on your business.
oss data-platform metadata metadata-management data-pipelines data-engineering observability data-catalog datacatalog data-discovery data-lineage bigdata alerting lineage data-profiling data-exploration data-governance data-quality data-science data-observability
Language:Java 1204
versatile-data-kit
vmware / versatile-data-kit
One framework to develop, deploy and operate data workflows with Python and SQL.
data-science data-engineering sql trino data-lineage etl elt data-pipelines data-engineer data-warehouse warehouse analytics snowflake dataops data-engineering-pipeline python data pipeline data-structures database
Language:Python 424
elementary-data / dbt-data-reliability
dbt package that is part of Elementary, the dbt-native data observability solution for data & analytics engineers. Monitor your data pipelines in minutes. Available as self-hosted or cloud service with premium features.
data dbt-packages data-reliability data-pipeline-monitoring data-pipelines analytics analytics-engineering data-observability data-lineage dbt dbt-artifacts dbt-tests
Language:Python 376
data-drift / data-drift
Metrics Observability & Troubleshooting
context data-monitoring data-observability data-quality dbt metrics semantic-layer dbt-metrics analytics data-diffing data-version-control drill-down reconciliation bigquery data-governance data-lineage data-reliability dbt-packages redshift snowflake
Language:HTML 318
tokern / data-lineage
Generate and Visualize Data Lineage from query history
data-governance data-lineage jupyter postgresql python
Language:Python 310
grai-io / grai-core
hacktoberfest data datalineage dbt open-source postgresql python mssql mysql snowflake data-science dataengineering fivetran django parquet redshift data-lineage
Language:Python 289
finos / waltz
Enterprise Information Service
enterprise-software architecture sparkjava jooq angularjs enterprise-architecture enterprise-information enterprise-tools data-lineage liquibase
Language:Java 181
tuva-health / tuva
Main repo including core data model, data marts, reference data, terminology, and the clinical concept library
analytics-engineering bigquery data-analytics data-governance data-lineage data-pipelines data-warehouse dbt dbt-packages healthcare healthcare-analysis healthcare-data open-source redshift snowflake sql terminology
Language:Python 179
GoogleCloudPlatform / bigquery-data-lineage
Reference implementation for real-time Data Lineage tracking for BigQuery using Audit Logs, ZetaSQL and Dataflow.
data-lineage bigdata bigquery zetasql dataflow data-governance data-management data-catalog
Language:Java 142
slidoapp / dbt-superset-lineage
Make dbt docs and Apache Superset talk to one another
dbt superset data-lineage lineage cli tool
Language:Python 133
maropu / spark-sql-flow-plugin
Visualize column-level data lineage in Spark SQL
data-lineage graph graphviz neo4j python scala spark sql visualization
Language:Scala 85
thestyleofme / data-lineage-parent
数据血缘，Hive/Sqoop/HBase/Spark等，发送到kafka后，解析处理使用neo4j生成血缘
kafka neo4j data-lineage lineage-hooks
Language:Java 78
GitDataAI / jiaozifs
A Git-like version control file system for data lineage & data collaboration.
data-collaboration data-versioning aiops data-mesh data-product dataops digital-twins enterprise-datahub mlops federated-learning data-lake-management data-version-control data-lake datalake git-for-data git-filesystem jiaozifs version-controlled-filesystem data-lineage
Language:Go 73
google / grizzly
End-to-end DataOps platform deployed by Terraform.
dataops dataops-platform gcp terraform airflow bigquery cloud-storage composer data-catalog data-loss-prevention dataflow git google-cloud google-cloud-platform pubsub spanner cloud-sql data-lineage
Language:Python 62
document-processing-pipeline-for-regulated-industries
aws-samples / document-processing-pipeline-for-regulated-industries
A boilerplate solution for processing image and PDF documents for regulated industries, with lineage and pipeline operations metadata services.
machine-learning aws cdk aws-lambda amazon-web-services processing-pipelines amazon-textract amazon-dynamodb amazon-elasticsearch-service amazon-comprehend amazon-s3 amazon-sns amazon-sqs aws-cdk pdf-processing image-processing data-analytics data-lineage image-processing-python data-governance
Language:Python 61
Tinkoff / data-detective
Data catalog for everything in your company
data-catalog metadata data-lineage data-governance data-detective
Language:Python 50
kun-scheduler
miotech / kun-scheduler
A workflow scheduler understands both your data and metadata.
data-management metadata data-lineage
Language:Java 27
stairlight
tosh2230 / stairlight
A data lineage tool detects table dependencies from rendered SQL statements.
sql data-lineage redash dbt bigquery data-engineering gcs s3 data-catalog data-governance data-ops data-discovery data-management lineage
Language:Python 27
tomaztk / SQLServer-Data-Lineage
Data Lineage for Microsoft SQL Server, Azure SQL Server and Azure Synapse
data-lineage microsoft-sql-server t-sql sql sql-server sql-server-database remove remove-comments azure-sql-database azure-synapse
Language:TSQL 17
GuinsooLab / darkseal
A Single place to Discover, Collaborate, and Get your data right
metadata catalog data-catalog data-discovery data-platform data-structures metadata-management metadata-standard guinsoolab data-documentation data-governance data-lineage data-security data-trust data-collaboration data-glossaries data-compliance data-alerting data-notification
Language:TypeScript 14
tuva-health / tuva_demo
A starter dbt project and synthetic claims dataset for trying out the Tuva Project.
analytics-engineering bigquery data-analytics data-governance data-lineage data-pipelines data-warehouse dbt healthcare healthcare-analysis healthcare-data healthcare-demo open-source redshift snowflake sql
14
tuva-health / medicare_cclf_connector
This connector is a dbt project that maps Medicare CCLF claims data to the Tuva Input Layer.
analytics-engineering bigquery data-analytics data-governance data-lineage data-pipelines data-warehouse dbt healthcare healthcare-analysis healthcare-data open-source redshift snowflake sql
12
tuva-health / medicare_lds_connector
Maps Medicare LDS claims data to the Tuva Input Layer so you can easily run the Tuva Project.
analytics-engineering bigquery data-analytics data-governance data-lineage data-pipelines data-warehouse dbt healthcare healthcare-analysis healthcare-data open-source redshift snowflake sql
10
brunocampos01 / pyssas
Build and deploy automated to SQL Server Analysis Services (SSAS) with Python.
ssas ssdt measures calculated-columns cube-builder visual-studio microsoft-sql-server analysis-services analysis-services-tabular olap olap-cube rolap azure-ssas data-lineage measure-dump export-sql mssql-ssas ssas-metadata ssas-on-linux python
Language:Python 9
pi2schema / pi2schema
Describe your Data Protection rules and Personal Identifying Information as part of your schema
gdpr gdpr-tracker lgpd schema protobuf avro kafka schema-registry schema-evolution governance data-governance data-lineage crypto-shredding hacktoberfest
Language:Java 9
beingPeeDi / sqlsense
Parse SQL statements and extract metadata and lineage information from it.
data-lineage lineage sql postgresql postgres python parser
Language:Python 8
badoo / exasol-data-lineage
Exasol data lineage scripts
exasol exasol-db lua data-lineage
Language:Python 6
IBM / multi-data-lineage-capture-py
IBM Multi-Lineage Data System
data-lineage artificial-intelligence provenance data-science machine-learning
Language:Python 6
tosh2230 / stairlight-app
A web application rendering table dependency graph with tosh2230/stairlight, using Graphviz, Streamlit and Google Cloud Run.
data-lineage cloudrun streamlit gcp graphviz
Language:Python 5
tuva-health / provider
A dbt project that transforms messy public provider datasets into usable data for the Tuva Project.
analytics-engineering data-analytics data-governance data-lineage data-pipelines data-warehouse dbt healthcare healthcare-analysis healthcare-data open-source providers snowflake sql
3
AbdullahMu / Data-Pipelines-with-Airflow
Schedule, automate, and monitor data pipelines using Apache Airflow. Run data quality checks, track data lineage, and work with data pipelines in production.
data-pipelines amazon-redshift airflow sql data-warehouse apache-airflow dag etl-pipeline s3-storage data-quality-checks data-lineage
Language:Python 2
Kuper-Tech / datahub-tags-distribution
Airflow DAG for automated distribution of tags based on the Data Lineage from DataHub
airflow data-compliance data-governance data-lineage datahub pii
1

data-lineage

open-metadata / OpenMetadata

elementary-data / elementary

MarquezProject / marquez

reata / sqllineage

opendatadiscovery / odd-platform

vmware / versatile-data-kit

elementary-data / dbt-data-reliability

data-drift / data-drift

tokern / data-lineage

grai-io / grai-core

finos / waltz

tuva-health / tuva

GoogleCloudPlatform / bigquery-data-lineage

slidoapp / dbt-superset-lineage

maropu / spark-sql-flow-plugin

thestyleofme / data-lineage-parent

GitDataAI / jiaozifs

google / grizzly

aws-samples / document-processing-pipeline-for-regulated-industries

Tinkoff / data-detective

miotech / kun-scheduler

tosh2230 / stairlight

tomaztk / SQLServer-Data-Lineage

GuinsooLab / darkseal

tuva-health / tuva_demo

tuva-health / medicare_cclf_connector

tuva-health / medicare_lds_connector

brunocampos01 / pyssas

pi2schema / pi2schema

beingPeeDi / sqlsense

badoo / exasol-data-lineage

IBM / multi-data-lineage-capture-py

tosh2230 / stairlight-app

tuva-health / provider

AbdullahMu / Data-Pipelines-with-Airflow

Kuper-Tech / datahub-tags-distribution