文件名称:php搜索引擎中文分词例子
文件大小:683KB
文件格式:RAR
更新时间:2011-11-06 19:49:06
php 中文分词
说明:本技术用于搜索引擎中文分词 程序使用自建词库,存储15多万(免费版10万左右)词,未压缩词库仅1.13M 程序自动过滤了诸如:█♀♂卍※ 平均每个词查找词库次数为2 使用分词类中的add_word方法可以很轻易扩展词库,稍加扩展可使程序具有学习功能 程序未对RMM和MM分词进行结果组合与筛选
【文件预览】:
test.php
HJ_SegWord_GBK.dat
HJ_SegWord_Class.php