邮编

时间:2024-03-02 02:05:21
【文件属性】:

文件名称:邮编

文件大小:2.1MB

文件格式:ZIP

更新时间:2024-03-02 02:05:21

Python

zipf软件包可以统计文本文件中单词的出现情况,并绘制每个单词的等级与频率的关系,以及一条直线,以表示Zipf定律。 动机 Zipf定律通常表示为一种观察模式,可以从文本中单词的频率和等级之间的关系中看出: “……最频繁出现的单词的出现频率大约是第二频繁出现的单词的两倍,第三频繁出现的单词的三倍,等等。” — 许多书籍都可以从诸如等网站以纯文本格式下载,因此我们创建此软件包的目的是定性地探索不同书籍与Zipf定律所预测的单词频率的吻合程度。 安装 pip install zipf 用法 安装此软件包后,可以从命令行使用以下三个命令 countwords用于计算文本中单词的出现次数。 collate以将多个单词计数文件整理在一起。 用于可视化单词计数的plotcounts 。 典型的使用场景包括在终端上运行以下命令: countwords dracula.txt > dracul


【文件预览】:
zipf-master
----README.rst(2KB)
----CITATION.md(664B)
----results()
--------dracula.csv(124KB)
--------moby_dick.csv(269KB)
--------frankenstein.csv(92KB)
----zipf()
--------plotcounts.py(4KB)
--------test_zipfs.py(2KB)
--------countwords.py(1KB)
--------utilities.py(528B)
--------collate.py(2KB)
----requirements.txt(45B)
----CONTRIBUTING.md(407B)
----setup.py(430B)
----data()
--------risk.txt(113B)
--------sherlock_holmes.txt(568KB)
--------dracula.txt(847KB)
--------frankenstein.txt(433KB)
--------time_machine.txt(196KB)
--------README.md(701B)
--------random_words.txt(34KB)
--------moby_dick.txt(1.2MB)
--------jane_eyre.txt(1MB)
--------sense_and_sensibility.txt(677KB)
----docs()
--------source()
--------conf.py(2KB)
--------index.rst(241B)
--------Makefile(634B)

网友评论