文件名称:Nomad - Tiny Search Engine-开源
文件大小:51KB
文件格式:GZ
更新时间:2024-07-23 20:47:45
开源软件
Nomad 是一个小巧但高效的搜索引擎和网络爬虫。 这对于在 Internet 和/或 Intranet 的 HTML 文档或知识库上的一组公司网站中进行搜索非常有用。
【文件预览】:
nomad
----search()
--------index.html(2KB)
--------nuts.gif(5KB)
--------py()
----README.html(5KB)
----README(4KB)
----CHANGE-LOG.txt(346B)
----bot()
--------urlstore.py(1KB)
--------urlnormalize.pyc(2KB)
--------Constants.py(2KB)
--------urlfeed.pyc(2KB)
--------urlnormalize.py(2KB)
--------debug.log(18KB)
--------Logger.py(2KB)
--------fetcher.pyc(3KB)
--------parser.pyc(2KB)
--------db.py(345B)
--------parser.py(1KB)
--------globalvars.py(177B)
--------fileutils.py(2KB)
--------urlstore.pyc(2KB)
--------timeout_http.pyc(5KB)
--------startup.txt(172B)
--------nutbox.py(3KB)
--------test()
--------indexer.py(6KB)
--------stats.py(2KB)
--------Logger.pyc(3KB)
--------fetcher.py(2KB)
--------urlfeed.py(894B)
--------Filer.py(997B)
--------initializer.py(949B)
--------TimeoutSocket.pyc(7KB)
--------timeout_http.py(3KB)
--------compress.py(1KB)
--------TimeoutSocket.py(4KB)
--------indexer.pyc(8KB)
--------TextSplitter.pyc(1KB)
--------TextSplitter.py(628B)
--------db.pyc(697B)
--------nutbox.pyc(6KB)
--------Filer.pyc(2KB)
--------crawler.py(1KB)
--------Constants.pyc(1KB)
--------globalvars.pyc(256B)
--------CreateTables.py(1KB)
--------initializer.pyc(2KB)
--------fileutils.pyc(3KB)
----LICENSE.txt(18KB)
----RELEASE-NOTES.txt(659B)