文件名称:基于核PCA和加权极限学习机的软件缺陷预测
文件大小:1.37MB
文件格式:PDF
更新时间:2024-05-16 09:09:47
研究论文
背景信息:软件缺陷预测致力于通过挖掘历史数据来检测容易出现缺陷的软件模块。 有效的预测使合理的测试资源分配成为可能,从而最终导致更可靠的软件。目的:软件缺陷数据中复杂的结构和不平衡的类分布使获取合适的数据特征和学习有效的缺陷预测模型具有挑战性。 在本文中,我们提出了一种解决这两个挑战的方法。方法:我们提出了一种称为KPWE的缺陷预测框架,该框架结合了两种技术,即内核主成分分析(KPCA)和加权极限学习机(WELM)。 我们的框架包括两个主要阶段。 在第一阶段,KPWE旨在提取代表性数据特征。 它利用KPCA技术通过非线性映射将原始数据投影到潜在特征空间中。 在第二阶段,KPWE旨在缓解班级失衡。 结果:我们对来自PROMISE数据集的34个项目和来自NASA数据集的10个项目进行了广泛的实验。 实验结果表明,与41种基线方法相比,KPWE表现出良好的性能,包括7种使用KPCA的基本分类器,5种KPWE的变体,8种具有WELM的代表性特征选择方法,21种不平衡学习方法。 ,这是一个新的软件缺陷预测框架,其中考虑了特征提取和类不平衡问题。 对44个软件项目的实证研究表明,在大多数情况下,KPWE优于基线方法。