NLP:自然语言处理 - 计算文本中的词频

时间:2024-06-25 13:50:44
【文件属性】:

文件名称:NLP:自然语言处理 - 计算文本中的词频

文件大小:10KB

文件格式:ZIP

更新时间:2024-06-25 13:50:44

Java

自然语言处理项目 该项目调查自然语言处理 (NLP) 中的一个主题,同时练习 AVL 树数据结构。 在 NLP 中,人们经常需要计算每个特定单词在文本中出现的次数。 对于语言建模,人们通常需要知道有多少不同的单词恰好在文本中出现了 r 次。 令 N(r) 是恰好出现 r 次的不同单词的数量。 因此,该程序可以根据给定的文本有效地计算 N(r)。 文本文件通过命令行参数指定,N(r)'s 在单独的行上打印到标准输出。


【文件预览】:
NLP-master
----StringComparator.java(788B)
----Position.java(89B)
----AVLnode.java(2KB)
----AVLTreeException.java(702B)
----calculateNr.java(3KB)
----AVLTreeInterface.java(2KB)
----DictEntry.java(518B)
----IntegerComparator.java(407B)
----AVLTree.java(15KB)
----README.md(611B)
----FileWordRead.java(3KB)
----Comparator.java(226B)

网友评论