文件名称:brian_bacik:Brian的数据科学项目组合
文件大小:1.87MB
文件格式:ZIP
更新时间:2024-03-28 23:06:13
数据科学组合 这些年来,我完成了一系列项目,重点介绍了数据科学领域的技能,包括数据整理,假设测试,数据库管理,可视化,机器学习和深度学习。 由UTHealth公共卫生学院与贝勒医学院和哈里斯县公共卫生合作的研究项目。 通过此研究项目,我们为哈里斯县的每个人提供免费测试,并收集数据以更好地了解Covid-19在该地区的传播。 我的职责包括数据架构,收集,清理,分析和可视化。 建立分类模型,以预测银行信用卡客户的流失率。 通过网格搜索交叉验证优化了线性回归,随机森林和XGBoost。 引入了具有随机欠采样,tomek链接消除和xgboost套袋的新颖建模方法,以实现更好的正分类。 通过考虑客户生命周期价值(LTV),误报/否定的成本以及保留客户的干预成本来进行ROI分析。 提出了最终模型的建议,并总结了类似问题的学习内容。 Pubmed搜寻器模块,用于从PubMed收集给定关键字
【文件预览】:
brian_bacik-main
----images()
--------profile.png(244KB)
--------corr_heatmap.png(111KB)
--------README.md(1B)
--------Dashboard-main.png(1.52MB)
--------36579565.jpeg(31KB)
----README.md(2KB)
----_config.yml(417B)