word_list_tools:Python 和 Pandas 工具可对不同类型的单词列表进行各种分析

时间:2024-07-22 02:37:42
【文件属性】:

文件名称:word_list_tools:Python 和 Pandas 工具可对不同类型的单词列表进行各种分析

文件大小:15.15MB

文件格式:ZIP

更新时间:2024-07-22 02:37:42

Python

word_list_tools Python 和 Pandas 工具可对不同类型的单词列表进行各种分析 注意:这个仓库在 2014 年 9 月 13 日彻底重组,我试图通过并确保所有路径都是有效的,但有可能被我忽略了。 使用的词库: COHA,来自杨百翰大学的美国历史英语语料库。 1-grams 需要许可证才能使用,所以这里不包括它们; .gitignore 有一个规则可以忽略 coha_1*.*。 此处包含元数据/摘要数据。 布朗语料库,python 的 NLTK 的一部分 Europarl: A Parallel Corpus for Statistical Machine Translation, Philipp Koehn, MT Summit 2005 ( ) [文件不包括,因为它们非常庞大] 使用的简单单词列表: 填字游戏单词的 Moby 列表(113,809 个


网友评论