基于提取网站层次结构的网页分类方法

时间:2014-11-17 09:48:49
【文件属性】:

文件名称:基于提取网站层次结构的网页分类方法

文件大小:360KB

文件格式:PDF

更新时间:2014-11-17 09:48:49

提取 网站 层次结构 网页 分类方法

网页自动分类是当前互联网搜索领域一个热点研究课题,目前主要有基于网页文本内容 的分类和基于网页间超链接结构的分类。但是这些分类都只利用了网页的信息,没有考虑到网页所 在网站提供的信息。文中提出了一种全新的对网站内部拓扑结构进行简约的算法,提取网站隐含的 层次结构,生成层次结构树,从而达到对网站内部网页实现多层次分类的目的,并且已经成功应用到 电子商务智能搜索和挖掘系统中


网友评论