ist的matlab代码-weighwords:用于从文本创建词云的Python库

时间:2024-06-15 01:49:31
【文件属性】:

文件名称:ist的matlab代码-weighwords:用于从文本创建词云的Python库

文件大小:1.45MB

文件格式:ZIP

更新时间:2024-06-15 01:49:31

系统开源

ist的matlab代码WeighWords是一个Python库,用于根据文本创建单词权重。 它可以用来创建词云。 WeighWords不会对词云进行可视化。 为此,您可以将其输出粘贴到或之类的工具中。 它不是使用简单的单词频率,而是通过称为简约语言模型的统计模型对单词进行加权。 这些模型擅长拾取将文本文档与集合中其他文档区分开的单词。 不利的一面是,您不能使用WeighWords来制作单个文档的词云。 您需要一堆文档进行比较。 安装 任何一个: pip install weighwords 或者: python setup.py install 参考 D. Hiemstra,S。Robertson和H.Zaragoza(2004)。 。 程序。 SIGIR'04。 R.Kaptein,D.Hiemstra和J.Kamps(2010)。 程序。 ECIR。


【文件预览】:
weighwords-master
----setup.py(577B)
----.gitignore(55B)
----weighwords()
--------parsimonious.py(5KB)
--------__init__.py(41B)
--------logsum.py(705B)
----lgpl-3.0.txt(7KB)
----gpl-3.0.txt(34KB)
----COPYING(794B)
----README.rst(1KB)
----example()
--------1400.txt.utf8.gz(383KB)
--------730.txt.utf8.gz(350KB)
--------dickens.py(1KB)
--------766.txt.utf8.gz(735KB)

网友评论