文件名称:CourseProject:数据清洗班课程项目
文件大小:58.31MB
文件格式:ZIP
更新时间:2024-07-07 04:57:48
R
课程项目 此项目的代码位于名为 run_analysis.R 的文件中。 为了运行此代码,需要将代码本中引用的源数据下载到工作目录并解压缩。 此外,我创建了一个临时文件 dataLabels.csv,它也需要从这个 repo 下载到工作目录中。 CSV 文件的描述在下面的步骤 4 中。 为了处理数据,我完成了 5 个步骤。 步骤 1:合并测试和训练数据集。 首先,我制作了一个名为 totalTrainData 的训练数据文件,该文件列组合了“x_train.txt”、“y_train.txt”和“subject_train.txt”数据文件。 它是 563 列 x 7,352 行。 接下来,我制作了一个名为 totalTestData 的测试数据文件,该文件将“x_test.txt”、“y_test.txt”和“subject_test.txt”数据文件列组合在一起。 它是 563
【文件预览】:
CourseProject-master
----codeBook.txt(7KB)
----dataLabels.csv(3KB)
----UCI Har Dataset()
--------features_info.txt(3KB)
--------features.txt(15KB)
--------activity_labels.txt(80B)
--------README.txt(4KB)
--------train()
--------test()
----tidydata.txt(744KB)
----README.md(4KB)
----run_analysis.R(2KB)