jLDADMM:用于LDA和DMM主题模型的Java包

时间:2024-02-24 12:31:32
【文件属性】:

文件名称:jLDADMM:用于LDA和DMM主题模型的Java包

文件大小:133KB

文件格式:ZIP

更新时间:2024-02-24 12:31:32

nlp topic-modeling lda short-text gibbs-sampling

jLDADMM:用于LDA和DMM主题模型的Java包 jLDADMM已发布,它为普通或短文本上的主题建模提供了替代方法。 概率主题模型,例如潜在狄利克雷分配(LDA)[1]和相关模型[2],被广泛用于发现文档集中的潜在主题。 但是,由于数据稀疏性以及此类文本中的上下文有限,将主题模型应用于短文本(例如Tweets)更具挑战性。 一种方法是在训练LDA之前将短文本组合成长的伪文档。 另一种方法是假设每个文档只有一个主题[3]。 jLDADMM提供了LDA主题模型[1]和每个文档一个主题的Dirichlet多项式混合(DMM)模型(即,字母组合的混合)[4]的实现。 LDA和DMM的实现分别使


【文件预览】:
jLDADMM-master
----License.txt(847B)
----src()
--------models()
--------jLDADMM.java(3KB)
--------utility()
--------eval()
----lib()
--------args4j-2.0.6.jar(35KB)
----jar()
--------jLDADMM.jar(65KB)
----test()
--------corpus.LABEL(3KB)
--------corpus.txt(13KB)
--------unseenTest.txt(7KB)
----README.md(9KB)
----build.xml(2KB)

网友评论