文件名称:webCrawler:存储库1 la IP。 网络爬虫
文件大小:29KB
文件格式:ZIP
更新时间:2024-03-07 21:50:53
Java
webCrawler 目录 后述 Este o aplicatie de tip网络爬虫护理,pornind de la un URL / fisier cu URL-uri,va descarca paginile各自的iar apoi,va descarca recursiv Paginile Catre Care存在一个链接uri。 De asemenea,主要景点名称为descarcate pcan mecanisme de filtrare dupa tip,注意州名称为sitemap具体的unui网站。 实用性 在公共场所使用公用设施的目的是: descarcarea recursiva a paginilor网络色情网站的网址详细信息 Cautare dupa cuvinte cheie filtrare dupa tip / dimensiune creare网站地图
【文件预览】:
webCrawler-master
----log.txt(0B)
----config.txt(143B)
----webCrawler.iml(423B)
----src()
--------URLParser.java(5KB)
--------FileException.java(1KB)
--------ConnectionException.java(1KB)
--------WordFreqs.java(852B)
--------Robot.java(5KB)
--------Logger.java(3KB)
--------Config.java(5KB)
--------Filter.java(3KB)
--------URLString.java(1KB)
--------CrawlException.java(1KB)
--------Sitemap.java(6KB)
--------Main.java(5KB)
--------WordIndexer.java(4KB)
--------PageCrawler.java(21KB)
--------LogCode.java(668B)
--------StackManager.java(6KB)
--------UnknownException.java(1KB)
----.idea()
--------misc.xml(271B)
--------modules.xml(260B)
--------.gitignore(47B)
--------vcs.xml(167B)
----README.md(2KB)
----input.txt(33B)
----.gitignore(4KB)