文件名称:lightning-talk:NLTK和自然语言处理
文件大小:12KB
文件格式:ZIP
更新时间:2024-05-23 01:12:20
Python
闪电谈话 NLTK和自然语言处理 这些文件是自然语言工具包的简介。 演示文件:nltk-test.py从requirements.txt安装了所需的库之后,可以运行该文件来演示nltk中的基本文本和标记化方法,包括COLLOCATIONS,CONCORDANCE和SIMILAR。 还生成了样本频率分布图(需要matplotlib)。 样本文本:murakami-norwood.txt村上春美(Harumi Murakami)的书“挪威的木材”的摘录,该书的作者对此进行了打字。 词干:stemming.py执行词干的示例。 停用词:stop-words.py从文件中的句子中过滤出停用词(无意义的词)的示例。 标记:tagging.py使用2005年和2006年国际电联地址(nltk语料库)中的文本进行词性标记的示例。 CHUNKING:chunking.py使用2005年和200
【文件预览】:
lightning-talk-master
----.gitignore(63B)
----requirements.txt(178B)
----tagging.py(1KB)
----stemming.py(445B)
----nltk-test.py(4KB)
----chunking.py(1KB)
----README.md(975B)
----stop-words.py(442B)
----murakami-norwood.txt(15KB)