文件名称:发现结果-tinyxml指南[中文]
文件大小:6.46MB
文件格式:PDF
更新时间:2024-07-04 16:39:26
RapidMiner
8.13 发现结果 8.3.6 评估 我们已经对模型的第一次运行了评估。 没有发现任何规则。 没有什么再需要评估的了, 对吧? 那么让我们切换回设计透视视图,看一下我们在前面的步骤中简要提到的参数。 有 两个主要系数用于表示是否要将频繁模式转化为关联规则,即 置信度和支持度。 置信度用 于衡量我们有多大的信心在一个属性被标记为 true 时,关联属性也被标记为 true。 在典型的购物篮分析示例中,我们可以看一下糕点和牛奶这两个常常彼此关联的项目。 如果我们查看十个购物篮并发现四个购物篮中购买了糕点,七个购物篮中购买了牛奶,并且 在购买糕点的四个购物篮中,有三个也购买了牛奶,则我们对以下关联规则有 75% 的信心: 糕点 → 牛奶。 其计算方式是用同时购买糕点和牛奶的例项数 3 除以这两项可能会同时发 生的例项数 4(3/4 = 0.75 或 75%)。 规则糕点 → 牛奶”有机会发生四次,但仅发生了三 次,因此我们对此规则的信心不是绝对的。 现在请想一想该规则的逆规则: 糕点 → 牛奶。 在十个假设的购物篮中,七个中发现 了牛奶,四个中发现了糕点。 我们知道同时购买这两种产品的购物篮数(或这两种产品之 间的关联频度)为三次。 因此我们对牛奶 → 糕点”的信心仅为 43%(3/7 =0.429 或 43%)。 牛奶被发现和糕点一起购买的机会为七次,但只发现了三次,因此我们对“牛奶→ 糕点” 的信心远低于对“糕点 → 牛奶”的信心。 如果某人到商店购买糕点,则我们对于他还将 购买牛奶的信心高于相反的情况。 这一概念在关联规则挖掘中称为“前提 → 结论”。 前 提有时也称为前件,而结论有时也称为结果。 对于每一对属性,置信度都会因哪个属性为