word-frequency-mack66hm:GitHub课堂创建的word-frequency-mack66hm

时间:2024-04-19 00:56:27
【文件属性】:

文件名称:word-frequency-mack66hm:GitHub课堂创建的word-frequency-mack66hm

文件大小:6KB

文件格式:ZIP

更新时间:2024-04-19 00:56:27

Python

词频 方向 在此项目中,您将使用open读取文本文件并计算该文件中单词的出现频率。 要计算单词的频率,您必须: 删除标点符号 将所有单词标准化为小写 删除“停用词”-经常使用的词被忽略 逐字逐句浏览文件,并记录每个字的使用频率 程序完成后,您应该能够运行python3 word_frequency.py seneca_falls.txt并获得如下打印报告: her | 33 ********************************* all | 12 ************ which | 12 ************ she | 7 ******* their | 7 ******* they | 7 ******* right | 6 ****** rights | 6 ****** such


【文件预览】:
word-frequency-mack66hm-master
----seneca_falls.txt(5KB)
----word_frequency.py(1KB)
----emancipation_proclamation.txt(4KB)
----README.md(1KB)
----.vscode()
--------settings.json(53B)

网友评论