文件名称:TextScrapperProject:文字抓取项目
文件大小:17KB
文件格式:ZIP
更新时间:2024-08-01 18:01:35
Java
文本抓取项目
这个java webscrapper 是一个强大的文本抓取器,它将连接到上的页面,并返回给定关键字的结果。这个scrapper 利用Jsoup HTML 抓取器从 com 获取页面。 使用该程序可以执行两个查询。 第一个查询是获取给定搜索关键字的查询总数。 第二个查询是通过给定的关键字查找所有结果详细信息。 该程序还包括处理无效参数、无效页码和使用某些关键字找不到页面或超过最大搜索页数的异常。 查询: 查询 1:(需要单个参数)java -jar Assignment.jar(例如 java -jar Assignment.jar "baby infanters")
Query 2: (requires two arguments)
java -jar Assignment.jar
【文件预览】:
TextScrapperProject-src
----.project(369B)
----README.md(3KB)
----bin()
--------brightedge()
----.settings()
--------org.eclipse.jdt.core.prefs(587B)
----src()
--------brightedge()
----.classpath(374B)