1、打开Explorer界面,选择数据集(这里以weather.nominal.arff为例),点击左上角的choose选择一个过滤器(Filter)。
值得注意的是,监督过滤器在过滤时会使用类的值,因此无监督过滤器使用的更广泛。
2、首先尝试删除湿度属性。观察属性栏后,发现humidity的标号为No.3。
选择unsupervised->attribute->Remove。
3、左键单击选择的属性过滤器,进行过滤器的配置。
4、在attributeIndices填写humidity属性的编号3,点击OK完成配置。
如果将invertSeletion勾选为True,则会删除除3以外的所有属性。
5、点击Apply,发现湿度属性被删除,湿度之后的属性编号-1。
如果要撤销操作,点击Undo即可。
****但如果只想删除湿度过高的实例呢?那就要使用实例过滤器了。
6、观察属性值栏,发现high的编号为1。且此时有7个实例的湿度都过高。
选择unsupervised->instance->RemoveWithValues。
8、和打开属性过滤器配置的操作一样,打开实例过滤器配置面板。
在attributeIndices填写humidity属性的编号3,在nominallndices填写high的编号1,点击OK完成配置。
9、点击Apply,发现湿度过高的实例数量由7变为了0。
如果要撤销操作,点击Undo即可。