文件名称:java 全文搜索网站
文件大小:3.25MB
文件格式:ZIP
更新时间:2010-10-01 04:22:16
java jsp lucene web
这个是复旦精华区的bbs搜索网站系统,分为2个系统,一个爬网页并建立索引,一个jsp web端。
程序中的不少部分用于解析页面。建立索引部分调整了默认参数。效率还可以,对于很大数据量(>10g)可能就比较慢了
【文件预览】:
bbsClawer.zip
bbssearch.zip
lib
----htmllexer.jar(68KB)
----lucene-core-2.1.0.jar(453KB)
----htmlparser.jar(281KB)
----IKAnalyzer.jar(842KB)