lda2vec

时间:2024-03-11 20:16:33
【文件属性】:

文件名称:lda2vec

文件大小:5.46MB

文件格式:ZIP

更新时间:2024-03-11 20:16:33

Python

lda2vec:解释自然语言的工具 lda2vec模型试图将word2vec和LDA的最佳部分混合到一个框架中。 word2vec捕获了单词之间的强大关系,但是生成的向量在很大程度上无法解释,并且不表示文档。 另一方面,LDA可以被人类很好地解释,但是不能像word2vec这样对本地单词关系进行建模。 我们构建了一个模型,该模型可以构建单词和文档主题,使其可解释,使主题遍历客户,时间和文档,并使它们成为受监管的主题。 警告:此代码是一系列实验。 它是研究软件,我们尝试简化修改lda2vec并使用您自己的自定义主题模型的过程。 但是,它仍然是研究软件。 我不会在Windows的生产环境中运行它,只有在您认为word2vec和LDA都不足,并且您想修改自己的炫酷模型后,才使用它:)那就是说,我不想阻止实验:这里有一些有限的文档,少量的单元测试以及一些入门的交互式示例。 资源 参见研究论文


【文件预览】:
lda2vec-master
----setup.py(560B)
----.gitignore(100B)
----images()
--------img01_lda.png(48KB)
--------img05_lda2vec_topics03_supervised.png(57KB)
--------img00_word2vec.png(44KB)
--------img04_lda2vec_topics02.png(63KB)
--------img03_lda2vec_topics01.png(57KB)
--------img06_pyldavis.gif(2.15MB)
--------img02_lda_topics.png(52KB)
----requirements.txt(60B)
----lda2vec()
--------topics.py(5KB)
--------__init__.py(524B)
--------corpus.py(29KB)
--------negative_sampling.py(7KB)
--------utils.py(1KB)
--------dirichlet_likelihood.py(1KB)
--------preprocess.py(4KB)
--------fake_data.py(2KB)
--------embed_mixture.py(4KB)
--------tracking.py(2KB)
----.travis.yml(955B)
----TODO(3KB)
----LICENSE(1KB)
----examples()
--------twenty_newsgroups()
--------hacker_news()
----README.rst(4KB)
----tests()
--------test_embed_mixture.py(782B)
--------__init__.py(0B)
--------test_preprocess.py(658B)
--------test_dirichlet_likelihood.py(2KB)
--------test_fake_data.py(1KB)
--------test_topics.py(1KB)
----pytest.ini(37B)
----lda2vec_network_publish_text.gif(413KB)
----.rtd(0B)
----docs()
--------Makefile(7KB)
--------api.rst(86B)
--------index.rst(1KB)
--------conf.py(10KB)
--------lda2vec()
--------make.bat(7KB)

网友评论