文件名称:论文研究-基于向量空间模型的多主题Web文本分类方法.pdf
文件大小:356KB
文件格式:PDF
更新时间:2022-08-11 16:35:31
向量空间模型,文本分类,多主题,数据挖掘
对给定的网页,提取其特征向量,计算网页特征向量与分类特征向量的相似度,使用Kmeans聚类方法寻找归属类得到动态阈值,提出了一种基于动态阈值的向量空间模型多主题Web文本分类方法。该方法通过网页与每个类的相似度和动态阈值的比较,实现了将包含多个主题的网页划分到相应的多个类中。实验证明,这种方法具有较好的精确度和召回率。