使用HTMLParser实现的网页内容解析工具

时间:2016-08-25 05:13:07
【文件属性】:

文件名称:使用HTMLParser实现的网页内容解析工具

文件大小:370KB

文件格式:RAR

更新时间:2016-08-25 05:13:07

HTMLParser 网页 解析

该程序在VS.Net C#开发环境中,使用公开源的HTML Parser网页解析类库实现了对静态页面(对异步加载的数据无效)的内容解析功能,能够解析提取新闻索引列表内容,以及新闻内容页面的正文内容。


【文件预览】:
myHtmlParser
----myHtmlParser.sln(926B)
----myHtmlParser()
--------InformationRetrival.cs(21KB)
--------bin()
--------myHtmlParser.csproj.user(168B)
--------Program.cs(903B)
--------obj()
--------myHtmlParser.csproj(3KB)
--------Winista.HtmlParser.dll(192KB)
--------Service References()
--------ClassDiagram1.cd(710B)
--------backup()
--------Properties()
----x.txt(3KB)
----Winista.HtmlParser.dll(192KB)
----myHtmlParser.suo(29KB)

网友评论

  • 最基础的网页解析,可根据需要,自行设计过滤器
  • 可惜不是java语言的,不过可以借鉴一下
  • 跟我的需求不太相符,但是可以学习一下