过滤不一致的数据-tinyxml指南[中文]

时间:2024-07-04 16:39:23
【文件属性】:

文件名称:过滤不一致的数据-tinyxml指南[中文]

文件大小:6.46MB

文件格式:PDF

更新时间:2024-07-04 16:39:23

RapidMiner

图 7.12 设置过滤条件 第四步:过滤不一致数据  在 Twitter 数据列中,有一个为“99”的不匹配数据,我们打算要把它替换为“N”,这 里我们调用“Replace”操作符,在设置参数里面,我们选择“single”单一属性,atttibute 属性选择“Twitter”,“replace what”选择“99”,replace by 填为“N”。参见图 7.13。  图 7.13 过滤不一致的数据 第五步:数据采样约简  在数据挖掘过程中,有时候数据集的数据内容太多,我们想取一半的数据进行模型的训 练,我们使用“Sample”采样操作符,在参数设置中我们选择“relative”相对成比例的采样


网友评论