【文件属性】:
文件名称:GCDProject:获取和清理数据项目
文件大小:117.51MB
文件格式:ZIP
更新时间:2021-06-10 03:25:52
R
获取和清理数据项目
这是约翰霍普金斯大学通过 Coursera 提供的获取和清理数据课程中的同行评估活动的项目。 目的是收集、处理和清理给定的数据集。
此存储库中包含以下文件:
自述文件
项目存储库和文件的总体描述。
密码本.md
描述如何收集数据的研究设计。
描述每个变量、数据以及为清理数据而执行的任何转换或工作的代码手册。
运行分析.R
R 中的脚本执行逐步数据清理。 它包含一个 ETL 过程,因为它旨在包括根据代码手册中描述的步骤执行该过程所需的所有必要的提取、转换和加载操作。
整理数据.txt
清理过程产生的整洁数据集。 它是通过在 R 中执行前面脚本提供的 ETL 过程获得的。
【文件预览】:
GCDProject-master
----TidyData.txt(220KB)
----data()
--------Human Activity Recognition Data Set.url(172B)
--------data.zip(59.66MB)
--------UCI HAR Dataset()
----CodeBook.md(12KB)
----run_analysis.R(18KB)
----README.md(1KB)