文件名称:数据沿袭:根据查询历史记录生成和可视化数据沿袭
文件大小:51KB
文件格式:ZIP
更新时间:2024-02-26 16:36:46
python jupyter postgresql data-governance data-lineage
数据库和数据湖的数据沿袭 数据沿袭是一个开源应用程序,用于查询和可视化AWS和GCP中的数据库,数据仓库和数据湖中的数据沿袭。 数据沿袭的目标是快速,简单的设置并允许对沿袭进行分析。 为了实现这些目标,数据沿袭具有以下功能: 从查询历史记录生成数据沿袭。 大多数数据库会保留几天的查询历史记录。 因此,用于捕获和存储元数据的基础结构的设置成本最小。 使用networkx图形库创建沿袭的DAG。 Networkx图形提供对数据沿袭的编程访问,从而提供了分析数据沿袭的丰富机会。 与Jupyter Notebooks集成。 Jupyter Notebook提供了一个出色的IDE,可以生成,操纵
【文件预览】:
data-lineage-master
----MANIFEST.in(29B)
----example.ipynb(5KB)
----Dockerfile(788B)
----.circleci()
--------config.yml(3KB)
----Pipfile.lock(58KB)
----.idea()
--------misc.xml(299B)
--------data-lineage.iml(634B)
--------inspectionProfiles()
--------modules.xml(276B)
--------.gitignore(38B)
--------vcs.xml(180B)
----.chglog()
--------config.yml(535B)
--------CHANGELOG.tpl.md(607B)
----pytest.ini(30B)
----LICENSE(1KB)
----test()
--------test_data_lineage.py(512B)
--------test_catalog.py(436B)
--------test_graph.py(12KB)
--------queries.json(2KB)
--------catalog.json(4KB)
--------test_dml_visitor.py(4KB)
----setup.cfg(216B)
----setup.py(3KB)
----README.md(3KB)
----Pipfile(425B)
----.pre-commit-config.yaml(498B)
----data_lineage()
--------__init__.py(22B)
--------server.py(2KB)
--------assets()
--------graph()
--------__main__.py(2KB)
--------parser()
--------visitors()
--------data_lineage.py(1KB)
--------log_mixin.py(177B)
--------catalog()
----.gitignore(3KB)
----.coveragerc(225B)