文件名称:支持度-置信度方法的不足-数据挖掘关联规则
文件大小:1.23MB
文件格式:PPT
更新时间:2024-05-12 14:43:48
数据挖掘
支持度-置信度方法的不足 Example 1: (Aggarwal& Yu, PODS98) 5000 个学生中 3000 喜欢打篮球 3750 喜欢吃米饭 2000 同时喜欢打篮球和吃米饭 关联规则:play basketball ⇒eat cereal [40%, 66.7%] 该规则具有欺骗性,因为从整个学生情况来看,有75%的学生喜欢吃米饭,大大高于66.7%。 关联规则:play basketball ⇒not eat cereal [20%, 33.3%] 该规则虽然拥有较低的支持度和置信度,但是比较精确。 Basketball Not basketball Sum (row) Cereal 2000 1750 3750 Not cereal 1000 250 1250 Sum(col.) 3000 2000 5000