文件名称:主要影响因素如下-电信业数据挖掘PPT
文件大小:3.35MB
文件格式:PPT
更新时间:2024-05-12 14:46:11
数据挖掘
主要影响因素如下: 被叫通话次数 被叫通话次数趋势 出账金额 预存款余额 预存款准备率:预存款余额/ARPU 在网月数 树根节点 被叫通话次数 规则1 决策树模拟 决策树挖掘模型图示 <=110次 >110次 >1.98元且<5.68元 <1.98元 出账金额 流失 不流失 预存款余额 <62元 >62元 被叫通话次数趋势 <36% >36% 优惠金额 <10元 >10元 预存款准备率 <68% >68% 在网月数 >6个月 <6个月 所谓决策树就是一个类似流程图的树型结构,其中树的每个内部结点代表对一个变量(取值)的判断,其分支就代表判断的每个结果;而树的每个叶结点就代表一个类别。树的最高层结点就是根结点。 为了对未知对象进行分类识别,可以根据决策树的结构对数据集中的属性值进行测试,从决策树的根结点到叶结点的一条路径就形成了对相应对象的类别预测。决策树可以很容易转换为分类规则 基本决策树算法就是一个贪心算法。它采用自上而下、分而制之的递归方式来构造一个决策树 *