GettingCleaningData:Coursera课程

时间:2024-07-18 17:07:47
【文件属性】:

文件名称:GettingCleaningData:Coursera课程

文件大小:4KB

文件格式:ZIP

更新时间:2024-07-18 17:07:47

R

获取清洁数据 我的代码基于什么目录结构? 我下载了“UCI HAR 数据集”,并将其用作我的工作目录。 而且我还保留子目录“test”和“train”而不移动任何文档。 为什么我上传的数据集是整齐的? 根据tidy dataset的定义,每一行代表一个观察值,每一列代表一个变量。 在我的数据集的最终版本中,每一行代表不同的主题活动组合,每一列是一个感兴趣的变量。 为什么描述性名称是描述性的? 对于活动名称,我使用了他们的 activity_labels.txt 文档中已经写的内容。 对于变量名,我只是简单地描述了变量代表什么,并稍微缩短了描述。 例如,tBodyAcc-Mean()-X 代表“x 轴上身体加速度信号的平均值”,我将该列命名为“BodyAccelerationMean-X”,它明显地说明了变量的含义。 每个变量名的更详细解释请阅读“CodeBook.md”文档。 而且码书


【文件预览】:
GettingCleaningData-master
----README.md(1KB)
----run_analysis.r(5KB)
----CodeBook.md(4KB)

网友评论