用JavaURL编程爬取并分析网页敏感词

时间:2022-08-04 18:51:11
【文件属性】:

文件名称:用JavaURL编程爬取并分析网页敏感词

文件大小:5KB

文件格式:ZIP

更新时间:2022-08-04 18:51:11

JAVA 爬虫 课程设计 实验

(1)编写界面,输入一个网址,能够爬取该网址上所有的HTML源代码。 (2)对网址中的文本进行提取。 (3)建立敏感词库,用文本文件保存。 (4)将该网址所对应的文本中的敏感词提取并高亮显示。 (5)编写文本文件,可以存入多个网址;程序可爬取这些网址中的文本内容,将敏感词记录存入另一个文件,格式自定。 (6)编写一个主界面,整合上述功能。


【文件预览】:
WebGroup.java
showContent.java
webPageResource.java
GUI.java

网友评论