文件名称:CleaningData:清洁数据项目存储库
文件大小:58.12MB
文件格式:ZIP
更新时间:2024-06-15 16:48:17
R
清洁数据 介绍 这是清洁Samsung活动的课程项目。 该项目的目标是合并,清理和命名活动数据的字段,以便可以将其用于其他数据科学任务。 还创建了一个整洁的数据集用于演示。 原始数据 原始数据被组织为一个目录,该目录包含X的功能集文件,活动文件y和包含执行任务的主题的主题文件。 数据也被分为两组,并组织在两个子文件夹中进行训练和测试。 清洁数据 首先,将工作目录设置为run_analysis.R和UCI HAR Dataset文件夹很重要。 功能名称是从UCI HAR Dataset文件夹中的“ features.txt”中读取的。 使用grep()函数只能选择包含mean()和std()的要素。 从同一目录的“ activity_labels.txt”文件中读取活动标签(例如WALKING , LAYING )。 对于测试数据集,它是从测试文件夹和X_test.txt文件中读取的
【文件预览】:
CleaningData-master
----tidyData.txt(51KB)
----CodeBook.md(5KB)
----Readme.md(2KB)
----run_analysis.R(2KB)
----UCI HAR Dataset()
--------README.txt(4KB)
--------train()
--------test()
--------features_info.txt(3KB)
--------features.txt(15KB)
--------activity_labels.txt(80B)