网页相似度计算之实词抽取

时间:2014-10-07 16:19:43
【文件属性】:

文件名称:网页相似度计算之实词抽取

文件大小:778KB

文件格式:RAR

更新时间:2014-10-07 16:19:43

网页相似度 htmlparser 搜索引擎

该demo利用htmlparser和正则表达式把网页的实词提取出来,为搜索引擎开发做准备


【文件预览】:
网页相似度计算之实词抽取
----extractor.rar(745KB)
----提取网页中文实词.doc(163KB)

网友评论