文件名称:getting-and-cleaning-data:Coursera“获取和清洁数据”课程的课程项目
文件大小:3KB
文件格式:ZIP
更新时间:2024-06-15 17:22:40
R
获取和清理数据 Coursera“获取和清洁数据”课程的课程项目。 该存储库包含一对文件。 一种是run_analysis.R 。 可以针对原始数据集运行此脚本,可在以下位置找到该脚本: 运行run_analysis.R时,您的工作目录应该是解压缩后的原始数据集。 run_analysis.R脚本从原始数据集中创建了一个更简单的中间数据集。 此中间数据集丢弃了一些变量统计信息,仅保留了33个变量中每个变量的均值和标准差值。 它包含来自原始数据集的测试数据和训练数据,总共包含10299个观测值。 从它可以粘合到单个数据帧数据的角度来看,这是很整齐的,原始数据集已将这些数据帧拆分为多个服务器文件。 它还用人类友好的标签替换了原始数据集中的活动代码。 最后, run_analysis.R脚本对中间数据应用aggregation操作,以产生其输出。 该输出为180个观测值中的66
【文件预览】:
getting-and-cleaning-data-master
----CodeBook.md(3KB)
----run_analysis.R(3KB)
----README.md(2KB)