文件名称:论文研究-基于多视图典型相关分析的垃圾网页检测.pdf
文件大小:405KB
文件格式:PDF
更新时间:2022-08-11 17:45:05
垃圾网页检测,典型相关分析,多视图分类,特征抽取
首先将垃圾网页特征分为两个不同的视图, 即基于内容特征的视图和基于链接特征的视图, 利用典型相关分析及其相关改进方法进行特征提取, 生成两组新的特征; 再对新生成的两视图特征采用不同组合方式产生单视图数据, 并用这组数据作为训练数据构建分类算法。实验结果表明, 将垃圾网页看成两视图数据, 并应用多视图典型相关分析技术, 可有效提高垃圾网页的识别精度。