文件名称:plsa 文本分析源码
文件大小:295KB
文件格式:RAR
更新时间:2015-03-02 04:55:26
matlab plsa 源代码
用于文本分析的pLSA算法。运行demo.m可看到示例程序。 data.mat保存的是“词-文本共生矩阵”X,行表示不同的词, 列表示不同的的文本。共有12个词,9个文本。 [pz pdz pwz pzdw]=plsa(X,k)可以产生文本、词的亲缘关系,用 概率pz=P(z),pdz=P(d/z),pwz=P(w/z),pzdw=P(z/d,w)表示. 关于算法的细节见pLSA.pdf。 X为“词-文本共生矩阵”,k为类别数。
【文件预览】:
pLSA
----pLSA.pdf(339KB)
----plsa.m(3KB)
----data.mat(260B)
----demo.m(605B)
----readme.txt(327B)