论文研究-基于不平衡数据集的客户流失预测研究.pdf

时间:2022-08-11 14:45:30
【文件属性】:

文件名称:论文研究-基于不平衡数据集的客户流失预测研究.pdf

文件大小:728KB

文件格式:PDF

更新时间:2022-08-11 14:45:30

类不平衡性,客户流失预测,机器学习,抽样法

目前客户流失预测面临的主要问题之一就是类不平衡性(class imbalance)。针对这个问题,首先应用欠抽样法(undersampling)处理客户流失数据降低不平衡性,再应用C4.5D、C4.5N、RIPPER、NaiveBayes和RandomForest机器学习方法对客户流失进行预测。实验结果表明,欠抽样法是在牺牲负类样本预测精度的前提下,提高正类预测精度,于是采用重复抽样法(resampling)来弥补欠抽样法的缺陷,减少负类样本中含有大量有用信息的丢失,实验结果证明了这种方法的正确性和有效性


网友评论