文件名称:过滤参数设置-tinyxml指南[中文]
文件大小:6.46MB
文件格式:PDF
更新时间:2024-07-04 16:39:28
RapidMiner
图 9.10 总体流程图 第一步:数据清洗 通过观察数据集的整体情况,我们发现在训练数据集中,决策能力这一栏的数据有一样, 按照规定,这个数据的取值范围是 0-100,并且最少能够得到 3 分,而在这里显示的是 0-103, 我们需要对数据进行处理。 另外,我们观察测试数据集的情况,它的决策数据值在 0-119,同样也超出的 3-100 的 正常取值范围,这地方我们在运行的时候也要进行处理。 我们调用“Filter Examples”操作符,把它与数据连接,我们在其参数配置中添加一个 过滤条件,我们选择保留决策能力大于等于 3,小于等于 100 的数据,如图 9.11。 图 9.11 过滤参数设置 第二步:线性辨别应用 搜索“Linear Discriminant Analysis”线性辨别分析操作符,并将其拖拽到执行界面加入 到执行流程中来,LDA 操作符不需要设置参数。 此外线性辨别分析需要标签属性,因此我们还需要 Set Role 角色操作符对“专供体育项 目”设置为“label”角色,如图 9.12。