文件名称:lda模型matlab代码-lda:Python中的(旧的,不好的)主题建模
文件大小:50KB
文件格式:ZIP
更新时间:2024-06-13 14:34:57
系统开源
lda模型matlab代码该项目将Gibbs采样推断实现为LDA(潜在狄利克雷分配)。 去做: 契克收敛 加快Gibbs采样过程 参考: @article {heinrich2005parameter,title = {用于文本分析的参数估计},作者= {Heinrich,G.},journal = {Web:,year = {2005}}} 笔记: 吉布斯采样非常慢,很难检查收敛性。 结果不是很好。 可能是因为语料库不是很大。 在不同的运行中,结果可能会非常不同。 主题建模工具: David Blei的收藏: UMass的槌槌: 斯坦福主题建模工具箱: Mark Steyvers和Tom Griffiths撰写的Matlab主题建模工具箱: LDA-J: R包:和 topic-modeling-tool(基于Mallet的图形用户界面工具):
【文件预览】:
lda-master
----topic-word.txt(3KB)
----stopwords_shortlist.txt(146B)
----document-topic.txt(1KB)
----lda.py(6KB)
----utils.py(1KB)
----main.py(3KB)
----stopwords.txt(4KB)
----README.md(1KB)
----.gitignore(16B)
----texts()
--------nyt()
--------tech_blog_posts()
--------grimm_fairy_tales()