ppldic.csv分词词库PHP应用——提取内容关键字

时间:2014-01-09 05:17:45
【文件属性】:

文件名称:ppldic.csv分词词库PHP应用——提取内容关键字

文件大小:25KB

文件格式:CSV

更新时间:2014-01-09 05:17:45

ppldic.csv 分词词库 php

用RMM分词算法可以实现,调用“ppldic.csv”中英文词库。在分词过程中要过滤掉 标点符号,否则,这些标点符号都将分成一个词,而这些词并不是用户查询搜索的关键内容。


网友评论

  • 词库太小了点,其他还好啦
  • 不好用,mei有什么实用的价值
  • 分词库太小了,有很多词都没有的。
  • 一点不好用,词不多
  • 这个东西确实不好用
  • 可以参考,直接用可能不够
  • 词汇有点少,作为基础词库要扩充才行
  • 这个东西确实不好用,词汇少是其中一个方面
  • 确实有点少,才2008,而且弄进去格式上,也是不对的,好像有两行有问题,因为少了个空格的缘故
  • 不是很好用,不过还不错了 2千零几条数据
  • 不好用,词确实太少了
  • 不过里面词条太少了
  • 我找到了。不过里面词条太少哦了,就2千来个