文件名称:LDAtools:适用于LDA主题模型的R包(不建议使用)
文件大小:6.88MB
文件格式:ZIP
更新时间:2024-06-05 00:09:50
JavaScript
LDA工具 R包,用于拟合主题模型。 更新:我们在2014年5月5日将此仓库的名称从“ LDAviz”更改为“ LDAtools”。 它将继续使用用于预处理原始文本和在R中拟合LDA主题模型的工具进行回购(使用C代码作为后端来运行折叠的Gibbs采样器)。 两个注意事项: 为了可视化主题模型的输出,请查看由Carson Sievert主持的我们的repo 。 此仓库中将完成以后所有关于主题模型可视化的工作。 对于拟合主题模型,还有其他可用的软件包,包括MALLET和R软件包“ topicmodels”和“ lda”,比该软件包更受欢迎且经过了更好的测试(针对速度和准确性)。 该软件包或多或少是为了(1)练习构建R软件包和(2)了解LDA而开发的,而不是成为其他人的广泛使用的软件包。 因此,感谢您对此进行检查,但是我们建议使用MALLET或其他现有R软件包来拟合主题模型,并建议使用来
【文件预览】:
LDAtools-master
----NAMESPACE(399B)
----DESCRIPTION(861B)
----src()
--------lda.c(6KB)
--------ldapredict.c(4KB)
--------minperplex.c(2KB)
----inst()
--------shiny()
----R()
--------postprocess.R(25KB)
--------fitLDA.R(7KB)
--------help.r(58B)
--------utils.R(2KB)
--------preprocess.R(36KB)
----LICENSE(1KB)
----README.md(2KB)
----data()
--------APtopdocs.rda(771KB)
--------APtopics.rda(236KB)
--------stopwords.rda(341B)
--------APcorpus.rda(2.08MB)
--------APinput.rda(687KB)
----man()
--------lu.Rd(381B)
--------getProbs.Rd(3KB)
--------token.rank.Rd(741B)
--------plotTokens.Rd(2KB)
--------topdocs.Rd(1KB)
--------flag.partial.Rd(2KB)
--------perplexity.bounds.Rd(2KB)
--------remap.terms.Rd(1KB)
--------preprocess.Rd(4KB)
--------bigram.table.Rd(2KB)
--------jsviz.Rd(2KB)
--------preprocess.newdocs.Rd(4KB)
--------flag.exact.Rd(2KB)
--------KL.Rd(417B)
--------predictLDA.Rd(2KB)
--------normalize.Rd(253B)
--------ent.Rd(582B)
--------su.Rd(366B)
--------plotLoglik.Rd(1KB)
--------collapse.bigrams.Rd(2KB)
--------fitLDA.Rd(2KB)
----tests()
--------run-all.R(61B)
--------test-filter.R(2KB)
----.gitignore(30B)