文件名称:Coursera-Getting-and-Cleaning-Data:Coursera 的“获取和清理数据”课程材料
文件大小:63.09MB
文件格式:ZIP
更新时间:2024-07-13 01:17:29
R
该脚本使用的原始数据可以从以下位置下载: : 解压缩此文件夹,然后确保生成的“UCI HAR Dataset”文件夹存在于工作目录中。 然后可以运行“run_analysis.R”文件,它会清理数据并将两个 .txt 文件保存到工作目录:“tidy_data.txt”和“tidy_data_means.txt”。 “run_analysis.R”文件的工作原理如下: 使用 read.table() 命令读取所有原始数据文件 使用 rbind() 命令连接测试和训练数据集 仅从原始数据中提取平均值和标准偏差测量值 活动名称重新格式化得更干净 使用 gsub() 命令清除变量名称 将生成的 tidy 数据集写入 .txt 文件,然后仅从第一个 tidy 数据集中选择每个变量的平均值,生成“tidy_data_means.txt”
【文件预览】:
Coursera-Getting-and-Cleaning-Data-master
----tidy_data.txt(7.95MB)
----README.md(1012B)
----codebook.md(7KB)
----getdata-projectfiles-UCI HAR Dataset.zip(59.66MB)
----run_analysis.R(3KB)
----tidy_data_means.txt(2.32MB)