文件名称:搜索引擎的设计与实现
文件大小:840KB
文件格式:ZIP
更新时间:2012-05-26 04:46:00
搜索引擎 lucene 网页抓取
网络中的资源非常丰富,但是如何有效的搜索信息却是一件困难的事情。建立搜索引擎就是解决这个问题的最好方法。本文首先详细介绍了基于英特网的搜索引擎的系统结构,然后从网络机器人、索引引擎、Web服务器三个方面进行详细的说明。为了更加深刻的理解这种技术,本人还亲自实现了一个自己的搜索引擎——新闻搜索引擎。 新闻搜索引擎是从指定的Web页面中按照超连接进行解析、搜索,并把搜索到的每条新闻进行索引后加入数据库。然后通过Web服务器接受客户端请求后从索引数据库中搜索出所匹配的新闻。 本人在介绍搜索引擎的章节中除了详细的阐述技术核心外还结合了新闻搜索引擎的实现代码来说明,图文并茂、易于理解。
【文件预览】:
中文分词--马亮亮
----源代码()
--------wordcutter()
--------words1.txt(1.72MB)
----安装说明()
--------安装说明.txt(185B)
----开题报告()
----论文()