web-crawler:简单的搜寻器,可从url mail-archives.apache.orgmod_mboxmaven-users爬网和下载指定年份的所有邮件

时间:2021-05-08 22:38:15
【文件属性】:
文件名称:web-crawler:简单的搜寻器,可从url mail-archives.apache.orgmod_mboxmaven-users爬网和下载指定年份的所有邮件
文件大小:70KB
文件格式:ZIP
更新时间:2021-05-08 22:38:15
Java 网络爬虫 简单的抓取工具,可从url抓取和下载指定年份的所有邮件: : 。 该项目必须具有一个构建系统,并且该构建系统应创建一个具有定义的应用程序入口点的jar(java -jar crawler-jar-with-dependencies.jar [opts]应该可以工作,假设crawler.jar是由Java创建的jar。构建系统) 工具: Maven JDK Jsoup JUnit Eclipsese IDE 迭代: 时间:1周可交付时间:可下载所有邮件的有效爬虫(编码:3天,测试:2天)。 时间:2周可交付时间:通用爬网程序,如果有任何邮件,它可以从指定的url下载所有邮件。 应用程序输入和输出概述: 对于普通履带 Input : Year in the format of 'YYYY' Validation : Application should v
【文件预览】:
web-crawler-master
----.gitignore(8B)
----WebCrowlerDesignDocument.doc(74KB)
----src()
--------main()
--------test()
----.classpath(1KB)
----.settings()
--------org.eclipse.m2e.core.prefs(86B)
--------org.eclipse.core.resources.prefs(150B)
--------org.eclipse.jdt.core.prefs(7KB)
----pom.xml(3KB)
----README.md(1KB)
----.project(536B)

网友评论