文件名称:使用JSoup实现新闻网页正文抽取
文件大小:9KB
文件格式:RAR
更新时间:2014-11-09 10:28:08
JSoup 新闻网页正文抽取
本程序用用解析工具JSoup,编程实现了新闻网页正文信息抽取,适用于新浪163qq等新闻网页信息抽取。开发工具为Eclipse,将工程导入到Eclipse后,直接运行NewsDown.java类。
【文件预览】:
NewsExtract
----src()
--------NewsDown.java(3KB)
--------NewsExtractor.java(3KB)
--------StringQuery.java(406B)
--------TestQuery.java(326B)
----bin()
--------NewsDown.class(4KB)
--------NewsExtractor.class(4KB)
--------TestQuery.class(803B)
--------StringQuery.class(869B)
----.classpath(358B)
----.settings()
--------org.eclipse.jdt.core.prefs(629B)
----.project(387B)