文件名称:Harvest Web Indexing-开源
文件大小:72KB
文件格式:GZ
更新时间:2024-05-14 06:18:31
开源软件
Harvest是一个Web索引程序包,最初是为分布式索引而设计的,它可以形成一个强大的系统来对大型和小型网站进行索引。 现在还包括Harvest-NG,这是一种高效的,基于Perl的模块化网络爬虫。
【文件预览】:
harvest-ng-1.0.2
----config()
--------firstrun.conf(644B)
--------full.conf(3KB)
----reap(9KB)
----README(201B)
----Harvest()
--------Reaper.pm(2KB)
--------Database()
--------Controller.pm(5KB)
--------Version.pm(2KB)
--------SingleThread.pm(2KB)
--------Object.pm(5KB)
--------Database.pm(3KB)
--------Version.pm~(2KB)
--------Debug.pm(2KB)
--------ClientServer.pm(10KB)
--------Reaper()
--------Config.pm(6KB)
--------Controller()
--------Object()
----INSTALL(230B)
----RELEASE-NOTES(86B)
----ChangeLog(41KB)
----CONTRIBUTORS(137B)
----util()
--------dump(469B)
--------graph(2KB)
--------gatherd(4KB)
--------whatsnew(1KB)
--------linkcheck(830B)
----COPYING(18KB)
----newsreap(5KB)