文件名称:PLSA:通过EM算法实现PLSA
文件大小:52KB
文件格式:ZIP
更新时间:2024-06-13 16:08:58
Python
这是通过EM(期望最大化)算法实现的PLSA(概率潜在语义分析)实现。 当前的问题: 该代码未经良好测试,因此可能包含错误。 测试文本位于文件夹./texts和./test中。 该代码似乎不适用于小型数据集,例如./test 参考: EM简介: : PLSA简介: : 笔记: 概率潜在语义分析教程”并不是很好的PLSA入门材料。 有一些已知的错误。
【文件预览】:
PLSA-master
----stopwords_shortlist.txt(146B)
----utils.py(1KB)
----main.py(3KB)
----stopwords.txt(4KB)
----plsa.py(8KB)
----plsa_multi.py(6KB)
----test()
--------fisherman_and_his_wife.txt(38B)
--------dog_and_sparrow.txt(101B)
--------briar_rose.txt(71B)
----README.md(709B)
----.gitignore(704B)
----texts()
--------nyt()
--------tech_blog_posts()
--------grimm_fairy_tales()