【文件属性】:
文件名称:GCD_CourseProject:Coursera 获取和清理数据类
文件大小:58.12MB
文件格式:ZIP
更新时间:2021-06-17 11:31:14
R
获取和清理数据
课程项目说明
您应该创建一个名为 run_analysis.R 的 R 脚本,它执行以下操作:
合并训练集和测试集以创建一个数据集。
仅提取每个测量值的平均值和标准偏差的测量值。
使用描述性活动名称来命名数据集中的活动
使用描述性变量名称适当地标记数据集。
根据步骤 4 中的数据集,创建第二个独立的 tidy 数据集,其中包含每个活动和每个主题的每个变量的平均值。
功能说明
三个语句封装了数据聚合、清理和整理过程。
merged_data <- merge_data("UCI HAR Dataset")
meanstd_dataset <- extract_meanstd(merged_data, "UCI HAR Dataset")
tidify_data(meanstd_dataset, "./tidy_dataset.txt")
这些语句各自调用 R 文件
【文件预览】:
GCD_CourseProject-master
----.gitignore(574B)
----CodeBook.md(3KB)
----UCI HAR Dataset()
--------features_info.txt(3KB)
--------features.txt(15KB)
--------activity_labels.txt(80B)
--------README.txt(4KB)
--------train()
--------test()
----README.md(2KB)
----tidy_dataset.txt(50KB)
----run_analysis.R(5KB)
----.gitattributes(378B)