NONO9527 / sqlflow

数据血缘

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

解析sql 获取表和列血缘关系,以及算子信息,代码是从 trino 中抽取的,trino sql语法支持比较全。实现其它数据库sql血缘解析,适当调整antlr4 语法文件,比较容易实现。

主要功能:

  1. 表与表血缘
  2. 列与列血缘
  3. sql 代码格式

TODO

  1. 基于 testcontainers 构建不同数据库测试用户
  2. 记录table和column 存储位置,目前已有location信息,需要保存多次出现位置
  3. 有解析算子,需要完善信息存储。
  4. 物化视图改写

About

数据血缘


Languages

Language:Java 97.1%Language:ANTLR 2.9%