文件名称:GettingandCleaningDataCourseProject
文件大小:5KB
文件格式:ZIP
更新时间:2024-07-18 17:18:05
R
介绍 这是约翰霍普金斯大学彭博公共卫生学院提供的数据科学签名轨道的 Coursera 获取和清理数据课程的课程项目。 其目的是获取数据集并将其转换为适合预期分析的整洁数据集。 主要的 R 脚本是 run_analysis.R,下面提供了详细说明。 创建整洁集的步骤 将训练和测试数据集合并为一个数据集。 提取每次测量的平均值和标准偏差。 使用描述性名称来命名数据集中的活动。 使用描述性变量名称标记数据集。 使用每个活动和每个主题的每个变量的平均值创建一个独立的整洁数据集。 1. 合并训练和测试数据集 训练和测试数据集位于称为测试和训练数据文件夹的相应文件夹中。 有一个文件activity_labels,它是一个数字活动和描述活动的表格。 有三个主要的并行向量,包括主题、活动和训练和测试数据集的实际测量值。 subject_test.txt 和 subject_train.txt 包含
【文件预览】:
GettingandCleaningDataCourseProject-master
----README.md(3KB)
----run_analysis.R(13KB)
----CodeBook.md(7KB)