文件名称:runanalysis:coursera 数据清理课程
文件大小:114KB
文件格式:ZIP
更新时间:2024-07-07 04:29:15
R
标题 输出 自述文件 html_document run_analysis.R 文件是一个 R 脚本,同时会将 UCI HAR 数据集中的数据转换为一个整洁的数据集。 run_analysis.R 文件应该在您的工作目录中。 UCI HAR 数据集的整个文件夹也应该在您的工作目录中。 脚本将深入数据文件夹并获取数据。 不会更改原始数据。 此脚本需要 dplyr 包。 该脚本首先将 6 个数据表和两个支持表(活动和特征名称)读入 R 变量。 然后通过首先将主题和活动列绑定到主数据上,然后将测试和训练数据集行绑定在一起,将 6 个表组合成一个大数据集。 然后它只提取标题中包含均值或标准差的数据列(加上主题和活动列)。 它将列重命名为更具可读性和 R 友好的标题。 然后它按主题和活动对数据进行分组。 (30 个科目和 6 个活动) 并对 180 个科目和活动组合的每一列取平均值
【文件预览】:
runanalysis-master
----sumall.txt(285KB)
----README.md(1KB)
----run_analysis.R(2KB)
----Codebook.txt(2KB)