使用nltk中的自带的类来调用Stanford nlp tools一直报错,具体原因是版本的原因,nltk需要3.0版本,并且nltk3.0只支持os/linux和windowX86。
接下来将Stanford开发的第三方工具包调用Stanford parser!
首先,需要下载 StanfordParser,下载3.6.0
还需要安装第三方工具包Stanford-parser-python, 下载
注意:Stanford-parser-python需要用到另一个工具包JPype,如果尚未安装,需要先安装JPype. http://www.lfd.uci.edu/~gohlke/pythonlibs/#lxml
下面配置Stanford-parser-python
1. 在工程下新建python包,将stanford-parser-python解压后拷贝进去,我的例子中包名为stanford-parser
2. 打开parser.py文件,进行配置
在打开的文件中找到startJvm函数,将其修改为图样式
其中,stanford_parser_home配置为stanford parser在你本机的所在目录
将此Parser的构造函数红线标注的部分修改为:
self.pcfg_model_fname = “%s/englishPCFG.ser.gz” % stanford_parser_home
现在终于配置完成,可以使用StanfordParser了