topic-extraction:使用基于图的方法提取副主题

时间:2024-07-23 04:21:33
【文件属性】:

文件名称:topic-extraction:使用基于图的方法提取副主题

文件大小:531KB

文件格式:ZIP

更新时间:2024-07-23 04:21:33

Java

主题提取 这个项目是我在 KTH 皇家理工学院的硕士论文项目的一部分。 项目名称:使用基于图的方法提取副主题。 该代码用于使用搜索引擎技术探索子主题提取,并结合主题候选的图中心性排名。 有关论文项目的更多信息,请访问: : 例子 示例结果文件: 输入文件: 大英百科全书对树的定义: 树,定期更新其生长(多年生)的木本植物。 大多数被归类为树木的植物都有一个包含木质组织的自立树干,并且在大多数物种中,树干产生次生枝条,称为树枝。 提取的主题: 系统抽取如下主题,按系统排序呈现: 树 多年生植物 植物茎 草本植物 植物形态学术语表 候选图: 提取的候选图用于对主题进行排名: 设置 下载: 下载 DBpedia * Pagelinks 数据集: 下载并安装 下载并安装 下载并安装 (用于可视化候选图) 配置弹性搜索 将 stopwords.txt 文件复制到


【文件预览】:
topic-extraction-master
----.gitignore(266B)
----topic-indexer()
--------src()
--------pom.xml(2KB)
----CreateGraph.cmd(186B)
----topic-api()
--------src()
--------pom.xml(2KB)
----stopwords.txt(4KB)
----CreateGraph.sh(142B)
----pom.xml(1023B)
----results.css(465B)
----README.md(4KB)
----topic()
--------src()
--------pom.xml(3KB)
----topic-extractor()
--------src()
--------pom.xml(2KB)
----.gitattributes(483B)
----docs()
--------resultGraph.jpg(59KB)
--------indexedData.png(411KB)
--------example()
--------workflow.jpg(41KB)

网友评论