文件名称:GettingAndCleaningData:Coursera 课程
文件大小:30.79MB
文件格式:ZIP
更新时间:2024-07-07 05:00:32
R
获取和清理数据 - 课程项目 这是课程项目源和结果的存储库。 如果您想自己运行它,请下载整个存储库并运行 run_analysis.R 文件。 run_analysis.R 文件的工作方式如下: 使用 read.table 从文件中读取所有数据 将相似的数据绑定在一起(各种数据类型的测试+训练数据) - 大约有。 10299 行 仅使用名称中包含“std”或“mean”的特征构建过滤特征列表 - 这将从 561 个特征中选择 86 个 过滤merge_set所以我们只有86列并设置适当的列名; 将标签和主题附加到数据中,并使用正确的名称; 用他们的名字替换活动编号; 此时我们有了第 4 步的数据集; 最后两行用于创建一个新的 tidySet,使用聚合函数,它允许我们为 3-88 的filteredSet 中的所有列运行均值函数,并按主题和活动列聚合结果。 这将导致每个活动 (6)
【文件预览】:
GettingAndCleaningData-master
----.gitignore(574B)
----untidy_data.txt(10.25MB)
----tidy_data.txt(285KB)
----features_info.txt(3KB)
----features.txt(15KB)
----codebook.md(2KB)
----activity_labels.txt(80B)
----README.txt(4KB)
----readme.md(1KB)
----train()
--------y_train.txt(14KB)
--------X_train.txt(62.94MB)
--------subject_train.txt(20KB)
----run_analysis.R(2KB)
----.gitattributes(378B)
----test()
--------X_test.txt(25.23MB)
--------subject_test.txt(8KB)
--------y_test.txt(6KB)