文件名称:论文研究-基于TF*IDF的垃圾邮件过滤特征选择改进算法.pdf
文件大小:682KB
文件格式:PDF
更新时间:2022-08-11 17:06:47
垃圾邮件,过滤器,贝叶斯,特征选择,TF*IDF
随着电子邮件的普及与应用,垃圾邮件的泛滥也越来越受到人们的关注。而如何进行邮件特征选择,是邮件分类中的重要问题。在介绍词频和倒文档频度的基础上,对几种常用的特征选择算法进行了分析和比较,针对现有特征选择算法过于机械的缺点,将关键字权重引入到邮件分类中,提出了一种基于关键词权重的TF*IDF特征选择改进算法,并进行了实验验证。实验结果表明,采用该算法改进后的贝叶斯过滤器具有更好的过滤效果。