基于TF*IDF的垃圾邮件过滤特征选择改进算法* (2009年)

时间:2024-06-13 16:00:54
【文件属性】:

文件名称:基于TF*IDF的垃圾邮件过滤特征选择改进算法* (2009年)

文件大小:557KB

文件格式:PDF

更新时间:2024-06-13 16:00:54

工程技术 论文

随着电子邮件的普及与应用,垃圾邮件的泛滥也越来越受到人们的关注。而如何进行邮件特征选择,是邮件分类中的重要问题。在介绍词频和倒文档频度的基础上,对几种常用的特征选择算法进行了分析和比较,针对现有特征选择算法过于机械的缺点,将关键字权重引入到邮件分类中,提出了一种基于关键词权重的TF*IDF特征选择改进算法,并进行了实验验证。实验结果表明,采用该算法改进后的贝叶斯过滤器具有更好的过滤效果。


网友评论