基于空间向量模型的垃圾文本过滤方法 (2014年)

时间:2024-05-29 04:36:55
【文件属性】:

文件名称:基于空间向量模型的垃圾文本过滤方法 (2014年)

文件大小:359KB

文件格式:PDF

更新时间:2024-05-29 04:36:55

自然科学 论文

针对垃圾文本识别计算的需求特性,应用VSM文本聚类算法思想,综合现有TFIDF算法特点,提出一种基于 VSM和改进的TFIDF特征项提取算法.本方法在对垃圾文本高聚类特征项权值进行放大的同时,有效减小由二类数据样本数量偏差对计算结果带来的影响,提高了垃圾文本过滤识别效率和准确率.为垃圾文本识别提供了一种新的改进算法选择.


网友评论