文件名称:C算法——离散化示例-决策树学习课件
文件大小:801KB
文件格式:PPT
更新时间:2024-05-14 17:17:51
决策树
C4.5算法——离散化示例 将“buy_computer”中的属性age的取值由{youth, middle_aged, senior}改为具体年龄{32, 25, 46, 56, 60, 52, 42, 36, 23, 51, 38, 43, 41, 65},C4.5算法离散化的具体过程。 (1) 对年龄序列由小到大排序,新的序列为{23, 25, 32, 36, 38, 41, 42, 43, 46, 51, 52, 56, 60, 65}; (2) 对新的年龄序列生成分割点:由于样本数量为14,因此可生成13个分割点。 例如:第一个分割点为(23+25)/2=24,它可将数据集划分为年龄在区间[23, 24]的样本和在区间(24, 65]的样本。