文件名称:europeananp-dbpedia-disambiguation
文件大小:252KB
文件格式:ZIP
更新时间:2024-07-12 23:11:52
Python
实体消歧 一个简单的 Python 库和网络服务,允许对标签数据库进行命名实体消歧。 这个想法是使用 Solr 查询来过滤可能的候选者,并使用对字符串相似性、内链数量和实体类型的更详细分析来选择“最佳”候选者。 它包含处理(多语言)DBpedia 转储并将它们加载到 Solr 后端的代码。 它还包含用于对在 Europeana Newspapers 项目上下文中使用的 ALTO 2.1 文件进行注释的帮助程序代码。 启动 Solr 这个项目需要一个 Solr 4 实例。 安装本地实例的脚本在这里: init\install-solr.sh 如果你使用这种方式,你可以使用 ./start-solr.sh 使用正确的配置启动本地实例 处理转储 从http://wiki.dbpedia.org/Downloads2014从 DBPedia (nt-format) 下载转储并将它们放入da