streamLDA:用于流式数据源主题建模的潜在狄利克雷分配

时间:2024-07-08 01:36:51
【文件属性】:

文件名称:streamLDA:用于流式数据源主题建模的潜在狄利克雷分配

文件大小:13.86MB

文件格式:ZIP

更新时间:2024-07-08 01:36:51

Python

更新 我不再维护这个 repo。 更新版本可在 用于潜在狄利克雷分配的流变分贝叶斯 Stream LDA 实现了 LDA 算法的一个版本,这样可以传入连续的文档流。分类器将继续学习新词并随着时间的推移优化主题,同时保持对内存需求的恒定限制。 Matthew D. Hoffman ( ) 的原始实现,(C) 版权所有 2009,Matthew D. Hoffman Jessy Cowan-Sharp ( ) 和 Jordan Boyd-Grader ( ) 的 这是免费软件,您可以根据 GNU 通用公共许可证的条款重新分发和/或修改它。 GNU 通用公共许可证不允许在专有程序中重新分发此软件。 分发此软件是希望它有用,但没有任何保证; 甚至没有对适销性或针对特定目的的适用性的暗示保证。 您应该已经收到一份 GNU 通用公共许可证以及该程序; 如果没有,请写信给 Free So


【文件预览】:
streamLDA-master
----.gitignore(45B)
----util.py(683B)
----LICENSE(34KB)
----streamlda.py(17KB)
----documentation.txt(2KB)
----twenty_news.py(2KB)
----tests.py(2KB)
----dirichlet_words.py(10KB)
----readme.md(3KB)
----wikirandom.py(5KB)
----data()
--------20_news.tar.gz(13.82MB)
----stream_corpus.py(3KB)
----corpora.py(151B)

网友评论