WebScrapper:简单的网页抓取工具 (JAVA)

时间:2024-07-10 13:14:11
【文件属性】:

文件名称:WebScrapper:简单的网页抓取工具 (JAVA)

文件大小:7KB

文件格式:ZIP

更新时间:2024-07-10 13:14:11

Java

网页抓取工具 简单的网页抓取工具 (JAVA) 创建时间:2014 年 11 月 6 日从控制台启动这个程序并添加如下参数: 使用示例: java -jar HireRightScraper.jar [URL_OR_URLS] [KEY_WORDS] –v –w –c –e 在哪里: URL_OR_URLS - 用于抓取 *.txt 文件中 URLS 列表的 URL 或路径(例如: : OR C:\urls.txt); KEY_WORDS - 您需要在页面上找到的单词列表(不含空格)(例如:Venus、project); -v - 有关数据抓取时间的信息; -w - 网页上提供的单词出现的次数; -c - 每个网页的字符数 -e - 包含给定单词的句子 将数据处理结果分别打印到每个 Web 资源和所有资源的总输出。 没有 3d 方库


【文件预览】:
WebScrapper-master
----src()
--------META-INF()
--------clarifying()
--------main()
----README.md(1007B)

网友评论