论文研究-最大熵模型在邮件分类中的应用.pdf

时间:2022-09-30 23:18:05
【文件属性】:

文件名称:论文研究-最大熵模型在邮件分类中的应用.pdf

文件大小:771KB

文件格式:PDF

更新时间:2022-09-30 23:18:05

论文研究

邮件分类是指在给定的分类体系下,根据邮件的内容和属性,确定其类别标签的过程。将最大熵模型应用于邮件分类中,给出了邮件的预处理过程,介绍了邮件信头特征,分析比较了特征数量和迭代次数、邮件特征字段对分类结果的影响,以及对层次分类和平面分类的效果进行了比较。实验表明,特征数量和迭代次数分别取2 000和250时为宜;充分利用邮件各字段信息,取得的总体分类效果最好,但对合法邮件,利用邮件头及邮件标题却取得了最好结果,并在层次分类中验证了这点,层次分类效果要优于平面分类。最后进行了总结和展望。


网友评论