Azure-Medicine-Data-Engineering:基于有关感染了血管的患者的数据和Azure工具(包括DataBricks)的数据科学项目

时间:2024-04-30 11:09:46
【文件属性】:

文件名称:Azure-Medicine-Data-Engineering:基于有关感染了血管的患者的数据和Azure工具(包括DataBricks)的数据科学项目

文件大小:14KB

文件格式:ZIP

更新时间:2024-04-30 11:09:46

Azure医学数据工程 基本说明 基于有关感染了血管的患者的数据和Azure工具(包括DataBricks)的数据科学项目 详细计划 将数据上传到Data Lake 将使用Azure数据工厂的数据链接 数据清理和准备**(此步骤将在Databricks笔记本中完成,该笔记本将从Data Lake上传数据) 将数据上传到Databricks 删除所有不包含任何数据的列和行(仅null) 检查天气自动转换列的数据类型是否正确,尤其是查询日期和数字数据(有时可能用点或逗号表示浮点数的风险) 在R中,我们将定义代表分类变量的列,并相应地定义 基本统计分析 收集和总结基本的患者数据,例如性别年龄... 分析放射线征象如何相互关联以及与其他分析变量之间的关系


【文件预览】:
Azure-Medicine-Data-Engineering-main
----factory()
--------VascularProsth.json(213B)
----dataset()
--------twoPointTimeStudy.json(4KB)
--------controlGroup.json(4KB)
--------studyGroupCSV.json(4KB)
----LICENSE(11KB)
----pipeline()
--------mainPipeline.json(3KB)
--------qualityAndOutlierrsControl.json(3KB)
----README.md(1KB)
----linkedService()
--------myKv.json(163B)
--------AzureDatabricks.json(427B)
--------AzureBlobStorage1.json(313B)

网友评论