文件名称:Getting-And-Cleaning-Data:获取和清理数据 Coursera 课程
文件大小:111KB
文件格式:ZIP
更新时间:2024-07-13 01:22:28
R
获取和清理数据 - Coursera,2015 年 2 月 此存储库包含通过 Coursera 获取和清理数据课程的文件,这是数据科学专业化的一部分,由约翰霍普金斯大学提供。 run_analysis.R 文件执行几个步骤来读入为项目提供的数据,将主题、活动和结果数据组合成一个组合数据框,并在准备最终整洁的数据集之前过滤以仅包括中值和标准差变量这包括按主题和活动划分的每个变量组的平均值。 更具体地说,run_analysis.R 完成以下步骤: 从相应的 .txt 文件中读取特征和活动,每个文件都进入一个数据帧; 读取训练数据 - 结果、主题和标签; 读取测试数据 - 结果、主题和标签; 在训练结果数据中添加主题和活动代码; 将主题和活动代码添加到测试结果数据中; 将这些训练和测试数据帧组合成一个新的数据帧 all_combo; 分配唯一的变量(列)名称,因为数据集包含重
【文件预览】:
Getting-And-Cleaning-Data-master
----ProjectOutput.txt(275KB)
----README.md(1KB)
----run_analysis.R(2KB)
----Codebook.md(8KB)