使用lucene4.10,IKAnalyzer5.0提取敏感词

时间:2017-12-12 02:58:36
【文件属性】:

文件名称:使用lucene4.10,IKAnalyzer5.0提取敏感词

文件大小:1.03MB

文件格式:RAR

更新时间:2017-12-12 02:58:36

lucene IKAnalyzer 提取敏感词

lucene中有扩展词库和停用词的概念,利用StopFilter加入违禁词的概念,可以返回检索到的违禁词。


【文件预览】:
IKAnalyzer
----ext.dic(48B)
----forbiddenwords.txt(2B)
----stopword.dic(316B)
----IKAnalyzer.cfg.xml(541B)
----org()
--------wltea()

网友评论

  • 有用 谢谢了
  • 还是参考官方文档比较好
  • 下载下来的,非常好用
  • 正在使用,目前还可以,等待最终使用结果。。。。
  • 入门资源,非常不错,感谢楼主
  • 虽然不是我想要的但还是学习了
  • 非常不错,感谢楼主
  • 不错,正式我需要的
  • 作为学习入门不错的。如果需要扩展更多功能,可以在这个基础上自行深化
  • 貌似好像这个分词不能超过6个还是8个字
  • for lucene 5.2.1的也出来了
  • 不错的资源
  • 下载下来的,非常好用
  • 不错,非常好用!
  • 貌似好像这个分词不能超过6个还是8个字
  • 下载下来的,非常好用