文件名称:heartFailurePrediction:使用集成学习和 Spark 预测心力衰竭
文件大小:3.04MB
文件格式:ZIP
更新时间:2024-06-24 19:47:11
Scala
抽象的 客观的 : 我们在本文中的目标是能够根据他的病史自动预测给定患者在不久的将来是否可能患有心力衰竭(充血性心力衰竭)。 方法 : 为实现这一目标,我们使用 ExactData 数据集中的 10,000 多名患者的医疗记录,在五年窗口内根据诊断、风险因素、用药史和实验室测试史构建特征。 然后,我们使用集成机器学习方法训练分类器,主要是使用逻辑回归和随机森林进行装袋。 然后我们使用 k 折交叉验证来评估性能并使用 Spark 中的 ML 管道框架选择分类器参数。 结果 : 我们能够在由 50% 的未患有这种疾病的个体和 50% 的被诊断患有心力衰竭的个体组成的测试集中实现超过 98% 的准确率,同时保持较低的假阴性率。 结论 : 我们在混淆矩阵方面取得了优异的成绩; 我们坐下来通过考虑数据集的潜在偏差来讨论它们。 指示 依赖项: Spark 1.3.0 Spark MLlib
【文件预览】:
heartFailurePrediction-master
----results.txt(4KB)
----.gitignore(293B)
----Presentation - Predicting Heart Failure using Ensemble Learning.pdf(867KB)
----README.md(2KB)
----build.sbt(983B)
----src()
--------main()
----data()
--------medication_fulfillment.csv(235KB)
--------encounter_dx.csv(282KB)
--------GeorgiaTech_DS1_CSV()
--------lab_results.csv(1.73MB)
--------encounter.csv(3.53MB)
----compilerun.sh(350B)
----Paper - Predicting Heart Failure using Ensemble Learning.pdf(425KB)
----sbt()
--------sbt-launch-0.13.1.jar(1.09MB)
--------sbt(2KB)
----project()
--------plugins.sbt(370B)
--------build.properties(20B)