【文件属性】:
文件名称:wikipedia-list-extraction:从Wikipedia中提取列表和表格,并将其信息添加到DBpedia
文件大小:4.61MB
文件格式:ZIP
更新时间:2021-05-12 16:14:11
Scala
*列表提取
从Wikipedia中提取列表和表格,并将其信息添加到DBpedia。
安装
确保已安装 , 和 。
克隆回购
安装jena CLI
在OS X上,您可以运行brew install jena
在其他平台上,您需要按所述安装它们
然后运行scripts/loadDumps.sh ,您可以选择使用scripts/typeCount.sh更新预加载的scripts/typeCount.sh 。
下载或创建Wiki标记xml转储。 从下载很好。
使用scripts/convert.sh将其转换为json转储。
将src/main/resources/application.conf-default复制到src/main/resources/application.conf ,您需要根据生成的转储文件更改输入文件名,并且可以更改算法的参数。
要启动应用程序,请运行s