抽样节点-数据挖掘原理与SPSS-Clementine应用宝典

时间:2024-05-13 18:17:30
【文件属性】:

文件名称:抽样节点-数据挖掘原理与SPSS-Clementine应用宝典

文件大小:9.07MB

文件格式:PPT

更新时间:2024-05-13 18:17:30

SPSS 数据挖掘

19.2.2抽样节点 ●模式 :模式选择是否通过(包含)或丢弃 (排除)记录。 ●样本:通过以下选项选择抽样方法: (1)从第一条记录开始连续抽取:选择使用连续数据抽样法。 例如,如果最大样本量设为 10,000,则前 10,000 个记录将通过流(如果模式为“包含”)或被丢弃(如果模式为 “丢弃”) 。 (2)n中取1:选择数据抽样法为每 n 个通过或丢弃一个记录。 例如,如果 n 设置为 5,则每五个记录将有一个记录根据上述模式通过或丢弃。 (3)随机%:选择随机抽取数据集一定百分比的样本。 例如,如果把百分比设置为 20,那么数据集有 20%的记录将会根据上述模式设置通过流或丢弃。 ●最大样本量:确定通过流程的最大样本量。如果想在选择 “n中取1”选项或“随机%”抽样选项中不使用该选项,可将最大样本量数目设置为超出数据集容量。 ●设置随机数种子:设置随机种子值,用于生成随机数。


网友评论