文件名称:用Na ive Bayes 方法协调分类Web 网页
文件大小:368KB
文件格式:PDF
更新时间:2013-12-20 05:39:08
超文本;W eb; 分类; 机器学习; 互联网;
WWW 上的信息极大丰富, 如何从巨量的信息中有效地发现有用的信息, 是亟待解决的问题, 而W eb 网页 的正确分类正是其中的核心问题. 针对超文本结构中的结构特征, 提出了用N aive Bayes 方法协调分别利用超文 本页面中的文本信息和结构信息进行分类的方法. 经实验验证, 与只用单种方法对超文本进行分类的方法相比, 综合分类法有效地提高了分类的正确率.