基于内容的中文网页自动分类研究

时间:2015-01-07 14:53:33
【文件属性】:

文件名称:基于内容的中文网页自动分类研究

文件大小:208KB

文件格式:PDF

更新时间:2015-01-07 14:53:33

自动分类; 信息检索; 全球网; 预处理

摘 要:本文主要介绍基于内容的网页自动分类系统,具体介绍了类别词典的建造方法, 网页超文本类别 词切分的方法,中文网页自动分类算法以及利用类别词与网页间的模糊关系对网页文本进行自动分类等内 容.通过对旅游网页进行测试, 自动分类正确率可达 93. 37 %以上,有效地提高了查准率和查全率.


网友评论