文件名称:数据准备预处理-weka完整教程
文件大小:2.11MB
文件格式:PPT
更新时间:2024-05-14 16:04:24
weka 教程 数据挖掘 建模
3、数据准备(预处理1) 删除无用属性 通常对于数据挖掘任务来说,ID这样的信息是无用的,我们将之删除。在区域5勾选属性“id”,并点击“Remove”。将新的数据集保存为“bank-data.arff”,重新打开。 此外,我们可以通过名为“RemoveType”的Filter删除某一类型的属性。 离散化 我们知道,有些算法(如关联分析),只能处理所有的属性都是标称型的情况。这时候我们就需要对数值型的属性进行离散化。在这个数据集中有3个变量是数值型的,分别是“age”,“income”和“children”。 其中“children”只有4个取值:0,1,2,3。这时我们可以通过名为“NumericToNominal”的Filter将children的类型变成Nominal。