mango:一个基于lucene的搜索引擎

时间:2024-05-22 15:37:10
【文件属性】:

文件名称:mango:一个基于lucene的搜索引擎

文件大小:35.17MB

文件格式:ZIP

更新时间:2024-05-22 15:37:10

Java

mango 是一个较为完善的搜索引擎.使用heritrix爬虫爬去网页信息,这里针对人民网进行了相关的爬去策略定制,其他网站的爬去,可自行根据相关网站的具体情况进行定制爬去策略.在搜索索引的建立是使用Lucene进行的.前端使用spring框架和dwr的异步刷新.由于是毕业设计的作品,较为粗糙,在这里放出来,仅供参考,有很多不足的地方,勿喷. ##mango_Heritrix 爬虫端 爬虫端,基于heritrix(具体相关heritrix文档,可百度!).导入项目后,在项目中可能会在Heritrix.java文件中"FileURLConnection"位置出现错误,这个错误是引用了sun包的原因,只需要右击项目选择设置(Properties)-java compoler-error/warrings 勾选enable project specific settings,拉动滚动条展开de


网友评论