文件名称:get-clean-project:Coursera 获取和清理数据课程项目存储库
文件大小:2KB
文件格式:ZIP
更新时间:2024-07-18 21:34:23
R
清理项目 Coursera 获取和清理数据课程项目存储库 文件的工作原理:run_analysis.R 该脚本假定已安装 dplyr 库。 它在“UCI HAR Dataset”目录中查找数据文件的数据文件 采购文件足以运行创建保存在当前目录中的整洁数据集的所有必要步骤。 它最初将必要的文件读入R内存,然后将测试和训练数据合并到“_all”后缀的变量中,并根据特征文件因素对列进行命名。 然后创建带有主题、活动和以 mean() 或 std() 结尾的列的初步结构。 主题列更改为因素,活动更改为可读活动标签。 基础数据集 分析的基础现在在 X_struct 数据中。 分析 列的平均值进入 X_means 数据,这是使用聚合函数完成的,数据首先按活动排序,然后按人排序。 这个顺序似乎最合乎逻辑,因为现在可以很容易地比较不同主体的相同活动。 该脚本最终将数据保存到一个名为:“tidy_d
【文件预览】:
get-clean-project-master
----README.md(1KB)
----run_analysis.R(3KB)