文件名称:cleaningdataProject:这是我在从 Coursera 获取和清理数据中的课程项目的存储库
文件大小:4KB
文件格式:ZIP
更新时间:2024-07-18 21:06:33
R
清洗数据项目 此存储库中包含的脚本用于清理数据集“Human Activity Recognition Using Smartphones” 脚本必须部署在“UCI HAR Dataset”文件夹中 run.analysis 函数利用 dplyr 包来汇总“train”和“test”目录中包含的数据 此脚本有两个主要输出 fullData - 非汇总的组合数据集 汇总数据 - “fullData”的汇总版本 这些是到达这些数据集所采取的步骤 0) 将 fullData 初始化为 Null 通过循环遍历两个子目录并绑定训练和测试的“主题”、“活动”和“结果”数据集来合并训练和测试原始数据集 一旦绑定了这些子数据集,我们将训练和测试组合成一个大数据集 现在已创建 fullData,在以下步骤中,我们使用描述性变量对其进行丰富 我们将列从“V1:Vn”重命名以反映可以在“features.t
【文件预览】:
cleaningdataProject-master
----CodeBook.md(5KB)
----run.analysis.R(3KB)
----README.md(1KB)