UindexWeb搜索

时间:2014-10-09 12:15:01
【文件属性】:

文件名称:UindexWeb搜索

文件大小:524KB

文件格式:RAR

更新时间:2014-10-09 12:15:01

UindexWeb搜索,蜘蛛程序,多线程

UindexWeb搜索是一个完整的蜘蛛程序,他的内部使用多线程, 多个自定义组件来实现搜索,在打开工程前,需要先安装如下自定 义组件: Uindex.pas (用来分析Html网页的组件) UindexStatusBar.pas (用来在状态栏画图片) HtmlDegest.pas (网页代码有效文本提取组件) HttpGetThread.pas (用来下载网页的组件) splitWord.pas (用来实现中文分词的组件) WriteThread.pas (用来访问数据库的组件) 和UindexFTP一样,也使用了dxNavBar这个外部组件来改善界 面,可以在盒子下载. 对于UindexWeb的结果搜索部分,与数据库的关系不是太大,蜘 蛛分析好的数据放入数据库后,结合索引程序,用户就可以获得 高性能的搜索体验.因此,编写索引程序是必须的,这里我采用了 开源的DotLucene作为索引器,他也是开源的,使用C#语言编写, 与Java版本的Lucene兼容,而且只需将索引文件放到服务器目录 就能实现搜索,再加上ASP.Net的支持,简直就是必然选择.


【文件预览】:
Uindex.dcu
Uindex_HtmlComponent.gif
UindexHtml解析组件.readme.txt
Uindex.pas
demo
----splitWord.pas(416B)
----UindexStatusBar.dcu(4KB)
----Spider.dof(2KB)
----HttpGetThread.pas(2KB)
----main.dcu(10KB)
----main.dfm(175KB)
----main.pas(4KB)
----HttpGetThread.dcu(3KB)
----Spider.dpr(378B)
----WriteThread.pas(3KB)
----HtmlDegest.pas(2KB)
----Spider.exe(1.06MB)
----resource()
--------cp.ico(1KB)
--------spider.ico(25KB)
----HtmlDegest.dcu(2KB)
----UindexStatusBar.pas(849B)
----Spider.res(26KB)
----Spider.cfg(434B)
----main.ddp(33B)
----splitWord.dcu(1KB)
----soweb.mdb(288KB)
----WriteThread.dcu(4KB)
UindexHtml解析组件使用指南.doc
Uindex.dcr

网友评论

  • 参考学习一下