论文研究-基于不平衡数据集的软件缺陷预测.pdf

时间:2022-08-11 12:47:09
【文件属性】:

文件名称:论文研究-基于不平衡数据集的软件缺陷预测.pdf

文件大小:869KB

文件格式:PDF

更新时间:2022-08-11 12:47:09

软件失效预测,不平衡数据,主成分分析,分类回归树

为了解决数据的不平衡性这一问题,提出一种利用分布函数合成新样本的过抽样和随机向下抽样相结合的算法。算法对降维后的主成分进行分布函数拟合,然后利用分布函数生成随机数,并对生成的随机数进行筛选,最后与随机向下抽样相结合。实验所用数据取自NASA MDP数据集,并与经典的SMOTE 向下抽样方法进行对比,从G-mean和F-measure值可以看出,前者的预测结果明显优于后者,预测精度更高。


网友评论