文件名称:graphkit:基于JSON模式处理数据
文件大小:16KB
文件格式:ZIP
更新时间:2024-05-28 04:05:13
Python
图形包 GraphKit是用于基于图的数据提取,转换和分析的管道处理工具。 该工具的图形模型基于带注释的定义。 典型的管道可能会从一组CSV文件或数据库表中提取数据,使用给定的架构将它们转换为JSON,将它们组合成RDF图,执行重复数据删除和数据集成,最后对结果进行一组查询图形。 阶段 图形处理管道应支持以下阶段/操作: csv:read :从CSV文件生成迭代器。 readtable :从SQL数据库表生成迭代器。 json:map :将JSON模式映射应用于来自源的数据。 rdf:load :将数据从JSON流导入三元组存储。 rdf:dedupe :基于某些外部映射文件应用sameAs映射。 rdf:sparql :运行SPARQL查询。 mql:query :运行一个MQL查询。 rdf:dump :将RDF数据导出到文件。 json:unmap :应用JSO
【文件预览】:
graphkit-master
----MANIFEST.in(55B)
----graphkit()
--------dumps.py(1KB)
--------cli.py(4KB)
--------util.py(1KB)
--------__init__.py(121B)
--------query.py(403B)
--------admin.py(137B)
--------mapping.py(744B)
----DESIGN.md(1KB)
----tests()
--------test_manager.py(2KB)
--------util.py(420B)
--------__init__.py(0B)
--------fixtures()
----LICENSE(1KB)
----examples()
--------everypol()
----setup.py(1KB)
----.gitignore(731B)
----Makefile(492B)
----README.md(2KB)