ScrapeTheWeb:Java Servlet,它获取URL并返回该页面上最常用的单词

时间:2024-06-03 14:54:09
【文件属性】:

文件名称:ScrapeTheWeb:Java Servlet,它获取URL并返回该页面上最常用的单词

文件大小:11.06MB

文件格式:ZIP

更新时间:2024-06-03 14:54:09

Java

ScrapeTheWeb Java Servlet,它获取URL并返回可以作为该页面的搜索查询传递的KEYWORD。 该servlet使用JSoup库从HTML DOM中提取数据。 针对少数网站以提取所需的正确关键字,然后将其传递给Quixey的API以显示与搜索查询相关的DVC。 该发球部署在Heroku上。 heroku端点中的url参数采用任何网站URL来返回搜索查询。


【文件预览】:
ScrapeTheWeb-master
----stopwords.txt(5KB)
----pom.xml(2KB)
----system.properties(26B)
----Procfile(64B)
----src()
--------main()
----ScrapeTheWeb.iml(3KB)
----.gitignore(29B)
----README.md(526B)

网友评论