文件名称:使用Rapidminer挖掘链接数据的网络-研究论文
文件大小:803KB
文件格式:PDF
更新时间:2024-06-09 16:30:40
Linked Open Data Data mining
来自不同域的许多数据以链接开放数据(LOD)的形式发布。 尽管有很多用于此类数据的浏览器以及用于特定目的的智能工具,但是仍然缺少通过挖掘链接数据网络来获取更多知识的通用工具。 在本系统论文中,我们介绍了RapidMiner链接开放数据扩展。 该扩展程序连接到功能强大的数据挖掘和分析平台,并为操作员提供了在RapidMiner中访问链接的开放数据的权限,从而无需复杂的SPARQL或RDF知识即可在复杂的数据分析工作流中使用它。 该扩展允许通过跟踪链接来自主浏览数据网络,从而即时发现相关数据集,以及整合在不同数据集中发现的重叠数据。 例如,我们展示了如何将世界银行以RDF数据立方体形式发布的科学出版物上的统计数据自动链接到其他数据集,并使用来自十个不同LOD数据集的其他背景知识进行分析。