文件名称:过滤不一致的数据-tinyxml指南[中文]
文件大小:6.46MB
文件格式:PDF
更新时间:2024-07-04 16:39:23
RapidMiner
图 7.12 设置过滤条件 第四步:过滤不一致数据 在 Twitter 数据列中,有一个为“99”的不匹配数据,我们打算要把它替换为“N”,这 里我们调用“Replace”操作符,在设置参数里面,我们选择“single”单一属性,atttibute 属性选择“Twitter”,“replace what”选择“99”,replace by 填为“N”。参见图 7.13。 图 7.13 过滤不一致的数据 第五步:数据采样约简 在数据挖掘过程中,有时候数据集的数据内容太多,我们想取一半的数据进行模型的训 练,我们使用“Sample”采样操作符,在参数设置中我们选择“relative”相对成比例的采样