Stanford Parser是斯坦福大学研发的用于语法分析的工具,属于stanford nlp系列工具之一。本文主要介绍Standfor Parser的入门用法。
- 在Stanford官方网站下载最新安装包(目前是3.6.0),点击 下载,下载最新的model stanford-english-corenlp-2016-01-10-models.jar
- 解压下载后的zip包 stanford-parser-full-2015-12-09.zip,里面会有数据,依赖包以及demo,还有相关的source code和java doc
- 使用Eclipse创建项目,名称stanfordparser,在build path中引入slf4j-api.jar,slf4j-simple.jar,stanford-parser.jar,stanford-parser-3.6.0-models.jar,stanford-english-corenlp-2016-01-10-models.jar
- 以ParserDemo为例,在stanfordparser中创建类ParserDemo.java,在步骤2解压的目录中找到ParserDemo,将内容拷贝到当前项目的ParserDemo中
- 在Eclipse中右键点击ParserDemo.java文件,设置运行参数Arguments为:edu/stanford/nlp/models/lexparser/englishPCFG.ser.gz C:/parserdata/english-onesent.txt,第一个参数是PCFG路径,models里已经提供,第二个参数是待分析的数据文件,在步骤2的解压目录的data下有
- 最后一步运行,输出结果如下:
(ROOT
(S
(NP (DT The) (JJ quick) (JJ brown) (NN fox))
(VP (VBD jumped)
(PP (IN over)
(NP (DT the) (JJ lazy) (NN dog))))
(. .)))[det(fox-4, The-1), amod(fox-4, quick-2), amod(fox-4, brown-3), nsubj(jumped-5, fox-4), root(ROOT-0, jumped-5), case(dog-9, over-6), det(dog-9, the-7), amod(dog-9, lazy-8), nmod:over(jumped-5, dog-9)]