文件名称:使用数据挖掘技术预测良性和恶性乳腺癌-研究论文
文件大小:394KB
文件格式:PDF
更新时间:2024-06-30 01:12:40
Breast cancer data
与所有其他癌症相比,乳腺癌是女性发生的第二大癌症。 2004 年记录了大约 110 万例病例。观察到这种癌症的发病率随着工业化和城市化以及早期检测设施的增加而增加。 它在高收入国家仍然更为常见,但现在在包括非洲、亚洲大部分地区和拉丁美洲在内的中等和低收入国家Swift增加。 在所有病例中,乳腺癌是致命的,并且是女性癌症死亡的主要原因,占全球所有癌症死亡人数的 16%。 本研究论文的目的是提出一份关于乳腺癌的报告,我们利用这些可用的技术进步来开发乳腺癌存活率的预测模型。 我们使用了三种流行的数据挖掘算法(朴素贝叶斯、RBF 网络、J48)来开发使用大型数据集(683 例乳腺癌病例)的预测模型。我们还使用了 10 倍交叉验证方法来测量无偏估计用于性能比较目的的三个预测模型。 结果(基于平均准确度乳腺癌数据集)表明,朴素贝叶斯是最好的预测器,对保持样本的准确度为 97.36%(该预测准确度比文献中报道的任何预测准确度都要好),RBF 网络出来了第二个以 96.77% 的准确率,J48 以 93.41% 的准确率排在第三位。