cleaning_data_project:获取和清理数据 Coursera 类项目的回购

时间:2024-07-07 05:22:40
【文件属性】:

文件名称:cleaning_data_project:获取和清理数据 Coursera 类项目的回购

文件大小:115KB

文件格式:ZIP

更新时间:2024-07-07 05:22:40

R

获取和清理数据:课程项目 介绍 这个存储库包含我为 Coursera 课程“获取和清理数据”的课程项目所做的工作,这是数据科学专业的一部分。 下面首先是我对原始数据的注释。 关于原始数据 特征(其中 561 个)未标记,可以在 x_test.txt 中找到。 活动标签位于 y_test.txt 文件中。 测试主题位于 subject_test.txt 文件中。 这同样适用于训练集。 关于脚本和整洁的数据集 我创建了一个名为 run_analysis.R 的脚本,它将测试集和训练集合并在一起。 此脚本的先决条件: 必须提取 UCI HAR 数据集并... UCI HAR 数据集的相关文件必须在工作目录中可用。 合并测试和训练后,添加标签,只保留与均值和标准差有关的列。 最后,脚本将创建一个整洁的数据集,其中包含每个测试主题和每个活动的所有列的平均值。 这个整洁的数据集将被写入一个名


【文件预览】:
cleaning_data_project-master
----CodeBook.md(3KB)
----run_analysis.R(2KB)
----project.txt(286KB)
----README.md(1KB)

网友评论