基于超链接分析的网页正文提取方法

时间:2016-12-16 08:20:04
【文件属性】:

文件名称:基于超链接分析的网页正文提取方法

文件大小:1.08MB

文件格式:DOC

更新时间:2016-12-16 08:20:04

网页提取

随着网络的迅猛发展, w eb服务已经成为研究的热点之一. 本文介绍了一种文件类型网页文件的文本信息预处理技术. 该方法能够解析网页文件的组成结构, 并从中提取出主体文本以供处理. 测试表明该方法能快速有效地得到大部分HTML网页的主体部分


网友评论