【文件属性】:
文件名称:em算法matlab代码-lda-matlab:Matlab的潜在Dirichlet分配
文件大小:45KB
文件格式:ZIP
更新时间:2021-05-26 17:07:24
系统开源
em算法matlab代码Matlab的潜在Dirichlet分配
这是David
Blei用C语言编写的Latent
Dirichlet
Allocation原始实现的Matlab版本。
该软件包包括一些API函数,这些函数通过mex接口内部调用原始C实现。
使用该软件包之前,
lda.make在Matlab中使用lda.make函数编译代码。
这是一个快速的用法示例:
corpus
=
lda.load_corpus('ap/ap.dat');
[model,
distribution]
=
lda.estimate(corpus,
'seeded',
...
'num_topics',
100,
...
'initial_alpha',
0.05);
distribution
=
lda.infer(corpus,
model);
corpus是单词计数的稀疏行向量。
corpus(d,
w)是文档d中单词w的计数。
结果distribution包含每一行中每个文档的主题权重行向量。
相同的示例在main.m演示函数中。
原料药
所有功能都在lda名称空间下。
estimate
R
【文件预览】:
lda-matlab-master
----.gitignore(20B)
----README.md(1KB)
----+lda()
--------load_corpus.m(230B)
--------private()
--------save_corpus.m(542B)
--------estimate.m(2KB)
--------make.m(1KB)
--------infer.m(1KB)
----src()
--------main.c(2KB)
--------lda.h(3KB)
--------mex()
--------api.cc(12KB)
--------cokus.c(7KB)
--------lda.c(22KB)
--------readme.txt(6KB)
--------cokus.h(464B)
--------Makefile(993B)
----main.m(556B)
----LICENSE.txt(26KB)
----doc()
--------todo.txt(272B)
--------inf-settings.txt(88B)
--------settings.txt(88B)
--------topics.py(1KB)