文件名称:使用 Rapidminer 挖掘关联数据网络-研究论文
文件大小:798KB
文件格式:PDF
更新时间:2024-06-29 12:35:27
Linked Open Data
来自不同领域的大量数据作为关联开放数据 (LOD) 发布。 虽然有相当多的浏览器可用于此类数据,以及用于特定目的的智能工具,但仍然缺少通过挖掘关联数据 Web 来获取额外知识的通用工具。 在本系统论文中,我们介绍了 RapidMiner Linked Open Data 扩展。 该扩展程序连接到强大的数据挖掘和分析平台 RapidMiner,并提供操作员以访问 RapidMiner 中的链接开放数据,允许在复杂的数据分析工作流中使用它,而无需 SPARQL 或 RDF 方面的专家知识。 该扩展允许通过跟踪链接自主探索数据网络,从而动态发现相关数据集,以及集成不同数据集中的重叠数据。 例如,我们展示了世界银行关于科学出版物的统计数据(作为 RDF 数据立方体发布)如何自动链接到更多数据集,并使用来自十个不同 LOD 数据集的附加背景知识进行分析。