使用基于 ELM 和 KELM 的特征选择模型进行软件缺陷预测-研究论文

时间:2024-06-30 01:30:27
【文件属性】:

文件名称:使用基于 ELM 和 KELM 的特征选择模型进行软件缺陷预测-研究论文

文件大小:629KB

文件格式:PDF

更新时间:2024-06-30 01:30:27

Extreme Learning Machine

上下文:软件缺陷预测 (SDP) 模型有助于向客户提供可靠且基于价值的产品。 然而,这些模型的性能受到数据集中存在的微不足道特征的影响。 这个问题是通过特征选择方法解决的。 目标:(1) 确定基于特征选择的分类模型在软件缺陷预测上下文中的性能,以及 (2) 确定去除不相关特征是否对 SDP 模型的性能产生显着影响。 方法:SDP模型是使用两个分类器构建的——极限学习机 (ELM) 和基于内核的极限学习机 (KELM) 基于五种包装器和七种基于过滤器的特征选择方法。 使用七个公开可用的数据集进行实验。 测试精度用作基于特征选择的 ELM 和 KELM 缺陷分类模型的性能比较参数。 结果: (1) 在比较基于特征的 SDP 模型的性能时,基于 ELM 的分类器使用基于包装器的特征选择方法实现了更高的测试精度,而 KELM 分类器使用基于过滤器的方法性能更好。 (2) 针对本研究的第二个目标,发现即使从原始软件项目数据中去除了 85% 以上的属性,在大多数情况下,去除不相关特征前后模型的预测性能仍具有可比性。的情况下,它在很少的实验中得到改善。 结论:对于基于特征选择的缺陷分类器,基于 ELM 和 KELM 的模型的性能分别优于基于包装器和过滤器的方法。 总体而言,降维空间不会显着影响 SDP 分类器的预测性能。 从某种意义上说,去除不相关的软件度量后得到的特征子集对输出类具有更大的意义。


网友评论