中文分词系统NLPIR(2015版)的Java接口使用学习

时间:2022-07-07 17:30:31

前言:

        这几天数据挖掘的大作业又用到分词了,首先想到的肯定是中科院的分词系统NLPIR,但是之前用的事2013版的,2015版的有了新的变化。增加了函数和效率自是不必说,由于我是用的java,所以必须使用NLPIR的java接口,NLPIR提供了一个jna的jar包,其实确切来说是打包成了一个bundle,可见NLPIR非常有雄心,以后也必定有更多的功能bundle。此外,新版的NLPIR使用了配置文件,瞬间高大上了有木有。利用.properties属性文件寻找NLPIR.dll的动态链接库文件和Data目录。还有NLPIR的在线演示真的吊炸天了!

        下面给出NLPIR下载的链接地址,我用的版本是2015版

 

使用:

           一、首先新建一个Java project 名叫Test,在Java Setting下的Libraries tag下,点击Add External Jars,导入jna-4.0.0.jar。这个jar包在我这的路径是E:\ICTCLAS2015\sample\JnaTest_NLPIR\lib。如图

                                                                        中文分词系统NLPIR(2015版)的Java接口使用学习

 

          二、可以看到在E:\ICTCLAS2015目录下有个Data目录,将其拖进Test的根目录下;

      三、在E:\ICTCLAS2015\sample\JnaTest_NLPIR目录下有一个nlpir.properties属性文件,将其拖进Test的根目录下,这两步的结果如下图;

                                                                                    中文分词系统NLPIR(2015版)的Java接口使用学习

              四、打开nlpir.properties属性文件,修改data_dir_parent_path和dll_or_so_path,其实data_dir_parent_path也可以不改,默认是".",这指明Data的路径是相对路径,即Test下根目录,当然也可以改成绝对路径。dll_or_so_path亦然,对于windows来说是导入.dll文件,对于linux是导入.so文件,我的nlpir.dll文件的路径是E:\\ICTCLAS2015\\lib\\win64\\NLPIR.dll;结果如下图所示:

                                                中文分词系统NLPIR(2015版)的Java接口使用学习

          五、我们可以新建一个class了此处名为NlpirTest,参考E:\ICTCLAS2015\doc下的开发文档有JNA接口的使用说明。将示例中的代码粘贴进NlpirTest,修改CLibrary Instance = (CLibrary) Native.loadLibrary(
    "E:\\ICTCLAS2015\\lib\\win64\\NLPIR", CLibrary.class);
中绿色的路径为你的NLPIR.dll的路径;结果如下图

                                            中文分词系统NLPIR(2015版)的Java接口使用学习

            六、最后我们就可以运行实例了;如图!SUCCESS!

中文分词系统NLPIR(2015版)的Java接口使用学习

 

NOTE

          1.  如果结果显示License过期,可以重新下载最新版,然后替换掉Data就可以了;

          2.  NLPIR推荐使用绝对路径,只要涉及到路径的地方都可以使用绝对路径。