Latent-Semantic-Analysis

时间:2024-05-10 17:18:46
【文件属性】:

文件名称:Latent-Semantic-Analysis

文件大小:8KB

文件格式:ZIP

更新时间:2024-05-10 17:18:46

Python

潜在语义分析 潜在思维分析(LSA)是一种理论和自然语言处理方法,用于分析一组文档与文档中包含的术语之间的关系。 一种称为“奇异值分解(SVD)”的数学技术用于检查非结构化数据,以查找术语和概念之间的隐藏关系。 有关LSA理论和方法的更多信息,可以在以下位置的论文中找到: : 。 在此存储库中实现的Python代码基于LSA方法。 给定一组文本文档,该代码可用于查找这些文档中单词之间的相关性以及该文档集中的文档之间的相关性。 此存储库中有4个子目录:源,输入,输出和脚本。 下面是每个子目录的描述: source: has the source code input: has the inputs data for the source code output: has the outputs from the source code scritps: has shell scr


【文件预览】:
Latent-Semantic-Analysis-main
----input()
--------doc6.txt(47B)
--------doc8.txt(55B)
--------doc5.txt(62B)
--------doc3.txt(41B)
--------doc4.txt(51B)
--------doc1.txt(54B)
--------doc2.txt(58B)
--------doc7.txt(39B)
--------doc9.txt(22B)
----output()
--------LSA.output(4KB)
----README.md(1KB)
----scripts()
--------run_pip_install.sh(39B)
--------runLSA.sh(251B)
----source()
--------utilities.py(876B)
--------LSA.py(5KB)

网友评论