论文研究-SBFS:基于搜索的软件缺陷预测特征选择框架.pdf

时间:2022-08-11 16:21:15
【文件属性】:

文件名称:论文研究-SBFS:基于搜索的软件缺陷预测特征选择框架.pdf

文件大小:1.21MB

文件格式:PDF

更新时间:2022-08-11 16:21:15

软件缺陷预测,特征选择,基于搜索的软件工程,类不平衡学习

在搜集缺陷预测数据集的时候,由于考虑了大量与代码复杂度或开发过程相关的度量元,造成数据集内存在维数灾难的问题。借助基于搜索的软件工程思想,提出一种新颖的基于搜索的包裹式特征选择框架SBFS。该框架在实现时,首先借助SMOTE方法来缓解数据集内存在的类不平衡问题,随后借助基于遗传算法的特征选择方法,基于训练集选出最优特征子集。在实证研究中,以NASA数据集作为评测对象,以基于前向选择策略的包裹式特征选择方法FW、基于后向选择策略的包裹式特征选择方法BW、不进行特征选择的方法Origin作为基准方法。最终实证研究结果表明:SBFS方法在90%的情况下,不差于Origin法;在82.3%的情况下,不差于BW法;在69.3%的情况下,不差于FW法。除此之外,若基于决策树分类器,则应用SMOTE方法后,可以在71%的情况下提高模型性能;而基于朴素贝叶斯和Logistic回归分类器,则应用SMOTE方法后,仅可以在47%和43%的情况下提高模型的预测性能。


网友评论