文件名称:dataproject:Coursera Data Science轨道中“获取和清理数据”类的数据项目
文件大小:3KB
文件格式:ZIP
更新时间:2024-06-15 16:41:10
R
脚本run_analysis.R从“使用智能手机进行人类活动识别”研究中读取文件,仅提取均值和标准差的度量,然后将它们组合为最终整洁的数据集,将这些数据按主题活动对进行平均。 数据集中有三种类型的数据文件,每种都有测试版本和培训版本。 测量文件(X)包含研究捕获的数据。 特征向量(特征)指示与每次测量相关的变量。 活动文件(y)指示与每个测量相关的活动(步行,坐着等)。 主题文件(主题)指示与每个测量相关联的主题。 首先,脚本使用特征向量分配列名称,读取特征向量和测量文件。 测试文件和培训文件合并为一个测量数据帧。 接下来,脚本读取活动文件,并将数据组合为一个活动矢量,标记为“ Activity”。 也将读取activity_labels文件并将其转换为向量,该向量用于使用描述性标签替换活动文件中的级别。 接下来,脚本读取主题文件,并将数据组合到一个主题向量中,标记为“主题”
【文件预览】:
dataproject-master
----codebook.txt(4KB)
----README.md(2KB)
----run_analysis.R(2KB)