中科院计算所的ICTCLAS分词包java

时间:2022-06-10 17:28:50

中科院计算所的ICTCLAS分词包,之前看文本聚类的时候看过,一直没仔细学。今天,有空,就去官网上下了个ictclas java包ICTCLAS50_Windows_32_JNI, 这个是最新版本。

1:没用eclipse 调试工具。

那个包里面有实例的,自己可以直接用,当然,自己也可以写的。我此次自己写了个实例如下:

import ICTCLAS.I3S.AC.ICTCLAS50;


public class ictclas_demo {
 public static void main(String[] args) {
  try {
   ICTCLAS50 testICTCLAS50 = new ICTCLAS50();
   // 分词所需库的路径
   String argu = ".";
   // 初始化
   if (testICTCLAS50.ICTCLAS_Init(argu.getBytes("GB2312")) == false) {
    System.out.println("Init Fail!");
    return;
   } else {
    System.out.println("Init Succeed!");
   }

   String sInput = "点击下载超女纪敏佳深受观众喜爱。禽流感爆发在非典之后。";
   byte nativeBytes[] = testICTCLAS50.ICTCLAS_ParagraphProcess(
     sInput.getBytes("GB2312"), 0, 0);
   System.out.println(nativeBytes.length);
   String nativeStr = new String(nativeBytes, 0, nativeBytes.length,
     "GB2312");
   System.out.println("The result is :" + nativeStr);
   testICTCLAS50.ICTCLAS_Exit();
  } catch (Exception ex) {
   ex.printStackTrace();
  }
 }
}
以上为本次实例java程序。

操作步骤:

(1)新建自己的工程目录ictclas_demo,把以上程序ictclas_demo.java放进去。

(2)把下载ICTCLAS50_Windows_32_JNI包解压,把其中API文件夹下的所有文件拷贝到自己的工程ictclas_demo目录下。

(2)在命令行下: 切换到ictclas_demo目录下:执行

$ javac ictclas_demo.java

$ java ictclas_demo

(3) 以上无问题,即可看到正确结果:中科院计算所的ICTCLAS分词包java

 

2. eclipse 下如何使用ICTCLAS包。

这个花了好长一段时间,总算搞定了,现在写下来,方便以后查看。

步骤如下:

(1) 新建一个ictclas_demo的eclipse的工程。把ictlcas_demo.java放到src目录下。

(2)为了使用ictclas包,不如把这个包从外面导入工程中。首先在ictclas_demo的工程名,点击右键,点击import,选择,导入File System ,选择导入的目录为我们下载的ICTCLAS50_Windows_32_JNI下的API文件夹,选中所有文件。点击finish。返回到eclipse的Package Explorer下,你就会看见导入的文件目录结构,到这还没完成任务,还要把ICTCLAS这个目录从外面目录下移到src目录下,就可以了。最终的目录结构如下:

中科院计算所的ICTCLAS分词包java

(3)以上没问题的话,就可以Builer Project了,点击Run就可以看到结果了。

同时注意下,在bin目录下,会生成一个ICTCLAS目录,注意,这个目录和src下的那个ICTCLAS目录是不一样的,里面的文件时.class, 而后者是.java文件。