java 全文搜索网站

时间:2010-10-01 04:22:16
【文件属性】:

文件名称:java 全文搜索网站

文件大小:3.25MB

文件格式:ZIP

更新时间:2010-10-01 04:22:16

java jsp lucene web

这个是复旦精华区的bbs搜索网站系统,分为2个系统,一个爬网页并建立索引,一个jsp web端。
程序中的不少部分用于解析页面。建立索引部分调整了默认参数。效率还可以,对于很大数据量(>10g)可能就比较慢了


【文件预览】:
bbsClawer.zip
bbssearch.zip
lib
----htmllexer.jar(68KB)
----lucene-core-2.1.0.jar(453KB)
----htmlparser.jar(281KB)
----IKAnalyzer.jar(842KB)

网友评论

  • 目前测试使用阶段,
  • 很有帮助。谢谢分享