文件名称:一种健壮有效的决策树改进模型
文件大小:207KB
文件格式:PDF
更新时间:2013-03-30 07:29:28
决策树
论文提出了一种健壮有效的决策树改进模型+82’*( 及其简化版本$ 该决策树模型基于著名的2’*( 决策树模型"但在属性的选取和分枝策略上进行了改进$ 对每一个属性计算对应样本子集的熵和样本子集熵的平均值"并将样本子集熵的值不小于平均值的样本子集进行合并"形成一个临时的复合样本子集"即合并分类效果较差的分枝$ 利用临时复合样本子集的熵值和未合并样本子集的熵值计算该结点的修正信息增益" 并选择具有最高修正信息增益的属性作为当前结点的测试属性$ 其分枝对应于未合并样本子集和复合样本子集$ 该模型的简化版本在数据预处理阶段完成$ +8 2’*( 决策树模型在提高测试属性选择度量的可解释性%减少空枝和无意义分枝"及过度拟合等方面有了显著的提高$