subtitle-wordcounter:计算文件夹中(UTF-8 编码).srt 文件中的所有单词

时间:2024-07-20 11:31:19
【文件属性】:

文件名称:subtitle-wordcounter:计算文件夹中(UTF-8 编码).srt 文件中的所有单词

文件大小:8KB

文件格式:ZIP

更新时间:2024-07-20 11:31:19

Python

副标题字计数器 计算文件夹中(UTF-8 编码).srt 文件中的所有单词 有人在一个句子中说“危险”和“区域”的频率有多高? 在您即将观看的那一集中喝什么词? 使用这个小脚本可以轻松查看这些统计数据。 运行它的最简单方法是将这两个文件复制到字幕所在的文件夹中。 然后简单地运行脚本(例如通过输入python3 subtitle-wordcounter.py )并按两次回车键。 现在,您将自动获得文件夹中所有 .srt 文件的前 10 个最常用词,以及总共使用超过 100 次的所有词。 许多在英语中大量使用的单词已从结果中过滤掉(甚至从计数算法中过滤掉)。 您可以通过编辑“excludes.txt”的内容轻松更改被遗漏的单词。 关于版本的通知 这是用 python 3.4 编写的,所以在 2.x 上运行时要厌倦版本问题 关于 UTF-8 编码的注意事项 == python 中的 .op


【文件预览】:
subtitle-wordcounter-master
----LICENSE(11KB)
----README.md(1KB)
----excludes.txt(315B)
----subtitle-wordcounter.py(7KB)

网友评论