web网页主内容抽取

时间:2012-08-12 16:36:37
【文件属性】:

文件名称:web网页主内容抽取

文件大小:1.72MB

文件格式:RAR

更新时间:2012-08-12 16:36:37

网页 内容抽取

从web page中提取主要内容,例如从新闻网页中提取新闻内容,且可以判别网页是否含有主内容。采用java编写,附送源代码(eclipse工程)和实例程序,并附赠一篇关于抽取方法的论文


网友评论

  • 感觉没什么用。。。 是有源码 但里面多是写的绝对路径,不知道什么内容。。
  • 感谢 最近正好正在研究这方面的内容
  • 研究一下,学习下作者的思路,这几天正在写这个
  • 正要对网页文本信息进行处理,正好有这个,学习学习。
  • 还不错,有源码,正在看~