java笔试题算法-topictiling:TopicTiling是一种基于LDA的文本切分方法

时间:2024-06-22 19:40:50
【文件属性】:

文件名称:java笔试题算法-topictiling:TopicTiling是一种基于LDA的文本切分方法

文件大小:174KB

文件格式:ZIP

更新时间:2024-06-22 19:40:50

系统开源

java笔试题算法主题平铺 Topic Tiling 是一种基于 LDA 的文本分割算法。 该算法受到由 开发的著名算法的启发,并使用潜在狄利克雷分配 (LDA) 主题模型分割文档。 TopicTiling 在线性时间内执行分割,因此在计算上比其他基于 LDA 的分割方法成本更低。 我已将项目从 SourceForge 移至 Github。 尽管代码仍然相同,但我已更新此页面上的文档。 对于 LDA 计算,我们在稍微修改的版本中使用,使该项目在 GPL 下获得许可。 表中的内容 二进制文件的使用 该工具是使用基于 unix 的系统开发和测试的。 由于 TopicTiling 是用 Java 编写的,因此它也应该在 Windows 机器上运行。 要启动 TopicTiling,您必须下载二进制文件 (|) 并解压缩存档。 要执行分段方法,请打开命令行并导航到未压缩的文件夹 cd topictiling_v1.0 我们提供了一个批处理脚本来启动 Windows 的分段: bash topictiling.bat 和一个 shell 脚本来启动基于 unix 的操作系统的分段: sh top


【文件预览】:
topictiling-master
----split_output.py(495B)
----topictiling.png(61KB)
----LICENSE(34KB)
----de.tudarmstadt.langtech.lda()
--------.project(556B)
--------src()
--------pom.xml(988B)
--------.classpath(1KB)
----README.md(8KB)
----de.tudarmstadt.langtech.semantics.segmentation.topictiling()
--------.project(587B)
--------src()
--------scripts()
--------README.txt(4KB)
--------pom.xml(1KB)
--------.classpath(1KB)

网友评论