文件名称:决策树代码
文件大小:16KB
文件格式:TXT
更新时间:2018-09-07 05:03:29
决策树
一) 需求和规格说明 (1) 决策树是通过一系列规则对数据进行分类的过程。它提供一种在什么条件下会得到什么值的类似规则的方法。它是一个从上到下、分而治之的归纳过程,是决策树的一个经典的构造算法。应用于很多预测的领域,如通过对信用卡客户数据构建分类模型,可预测下一个客户他是否属于优质客户。 (2) 分类是数据挖掘、机器学习和模式识别中一个重要的研究领域。数据分类是一个两步过程。第一步,使用已知类别标记的训练数据集建立一个分类模型。例如:图1是一个决策树模型。第二步,对未知标记的数据使用模型进行分类。例如,根据图1的决策树模型,运用自顶而下的属性测试过程,将表2中的样例1-6分别分类为“Y”、“Y”、“Y”、“Y”、“N”、“N”。 图1. 一个决策树模型的例子 (3) 举例:对下表运用算法构建决策树 表1. 一个训练数据集