论文研究-基于向量空间模型的多主题Web文本分类方法.pdf

时间:2022-08-11 16:35:31
【文件属性】:

文件名称:论文研究-基于向量空间模型的多主题Web文本分类方法.pdf

文件大小:356KB

文件格式:PDF

更新时间:2022-08-11 16:35:31

向量空间模型,文本分类,多主题,数据挖掘

对给定的网页,提取其特征向量,计算网页特征向量与分类特征向量的相似度,使用Kmeans聚类方法寻找归属类得到动态阈值,提出了一种基于动态阈值的向量空间模型多主题Web文本分类方法。该方法通过网页与每个类的相似度和动态阈值的比较,实现了将包含多个主题的网页划分到相应的多个类中。实验证明,这种方法具有较好的精确度和召回率。


网友评论