决策树分类算法中C4.5算法的研究与改进

时间:2024-05-26 06:26:24
【文件属性】:

文件名称:决策树分类算法中C4.5算法的研究与改进

文件大小:880KB

文件格式:PDF

更新时间:2024-05-26 06:26:24

决策树 C4.5算法 朴素贝叶斯分类 UCI

C4.5算法是用于生成决策树的一种经典算法,虽然其有很强的噪声处理能力,但当属性值缺失率高时,分类准确率会明显下降,而且该算法在构建决策树时,需要多次扫描、排序数据集、以及频繁调用对数,针对以上缺点,本文提出一种改进的分类算法.采用一种基于朴素贝叶斯定理方法,来处理空缺属性值,提高分类准确率.通过优化精简计算公式,在计算过程中,改进后的计算公式使用四则混合运算代替原来的对数运算,减少构建决策树的运行时间.为了验证该算法的性能,通过对UCI数据库中5个数据集进行实验,实验结果表明,改进后的算法极大的提高了运行效率.


网友评论