gensim:人类主题建模

时间:2024-02-23 22:12:28
【文件属性】:

文件名称:gensim:人类主题建模

文件大小:56.97MB

文件格式:ZIP

更新时间:2024-02-23 22:12:28

python nlp data-science machine-learning natural-language-processing

gensim – Python中的主题建模 Gensim是用于主题建模,文档索引和大型语料库相似性检索的Python库。 目标受众是自然语言处理(NLP)和信息检索(IR)社区。 产品特点 所有算法均与语料库大小无关(可以处理大于RAM的输入,流式处理,核外处理), 直观的界面 轻松插入您自己的输入语料库/数据流(简单的流式API) 易于使用其他向量空间算法(简单转换API)进行扩展 流行算法的高效多核实现,例如在线潜在语义分析(LSA / LSI / SVD) ,潜在狄利克雷分配(LDA) ,随机投影(RP) ,分层狄利克雷过程(HDP)或word2vec深度学习。 分布式计算:可以在计算机集群上运行潜在语义分析和潜在Dirichlet分配。 广泛的。 如果此功能列表让您不知所措,则可以首先在Wikipedia上阅读有关和更多信息。 安装 该软件依赖于用于科学计算的两个Python软件包 。 在安装gensim之前,必须先安装它们。 还建议您在安装NumPy之前安装快速的BLAS库。 这是可选的,但是已知使用优化的BLAS(例如或可以将性能提高多达一个数量级。 在OS


网友评论