文件名称:ProjectCurse:项目课程所需文件的存储库
文件大小:87KB
文件格式:ZIP
更新时间:2024-07-18 16:11:45
R
获取和清洗数据:课程项目介绍 这个存储库包含我为 Coursera 课程“获取和清理数据”的课程项目所做的工作,这是数据科学专业的一部分。 下面首先是我对原始数据的注释。 关于原始数据 特征(其中 561 个)未标记,可以在 x_test.txt 中找到。 活动标签位于 y_test.txt 文件中。 测试主题位于 subject_test.txt 文件中。 这同样适用于训练集。 关于脚本和整洁的数据集 我创建了一个名为 run_analysis.R 的脚本,它将测试集和训练集合并在一起。 此脚本的先决条件: 必须提取 UCI HAR 数据集,并且.. UCI HAR 数据集必须位于名为“UCI HAR 数据集”的目录中。合并测试和训练后,添加标签,仅保留与平均值和标准偏差有关的列。 最后,脚本将创建一个整洁的数据集,其中包含每个测试主题和每个活动的所有列的平均值。 这个 tid
【文件预览】:
ProjectCurse-master
----tidydata.txt(218KB)
----run_analysis.R(4KB)
----README.md(1KB)
----codebook.md(3KB)