POS-Tagging-for-KeyWord-Extraction:关键字提取

时间:2024-05-17 12:40:01
【文件属性】:

文件名称:POS-Tagging-for-KeyWord-Extraction:关键字提取

文件大小:5.07MB

文件格式:ZIP

更新时间:2024-05-17 12:40:01

java natural-language-processing stanford pos-tagging extract-keywords

一种使用斯坦福大学自然语言处理对数线性POS标记从任何句子中提取关键字的算法 我已经在Java中使用了Stanford的(自然语言处理)对数线性POS标记器来处理.xml文件并提取<title> ..... </ title>标记中存在的句子。 然后,使用词性标记器对提取的句子进行标记,该库可在Stanford NLP的网站上找到。 您可以在下载该库并获取有关其用法的 在Java代码中,对于关键字,我主要考虑了名词,形容词和动词。 基本上,这些是实际上在查询中起作用的单词。 例如,如果我们有一个句子,例如“ Mercedes and it's cars”。 这里感兴趣的词主要是“ Mercedes”和“ car”,事实证明它们是名词。 有关POS标签的详细信息,请参见“ POS标记术语Meanings.txt”或 为了使代码正常运行,请创建一个文件夹并将所有文件(除了-“ title


【文件预览】:
POS-Tagging-for-KeyWord-Extraction-master
----.project(366B)
----.gitattributes(66B)
----taggers()
--------english-left3words-distsim.tagger.props(1KB)
--------english-left3words-distsim.tagger(11.83MB)
----src()
--------brillTaggerStanford()
----title.txt(2KB)
----POS tagging terms meanings.txt(1KB)
----README.md(2KB)
----META-INF()
--------MANIFEST.MF(23B)
----.classpath(417B)
----.gitignore(278B)
----reqfile.txt(2KB)
----query.txt(19KB)

网友评论