文件名称:Samsung_data_cleaning
文件大小:3KB
文件格式:ZIP
更新时间:2024-06-15 17:21:24
R
Samsung_data_cleaning 读取每个数据集: 读取主文件夹中的features.txt文件以获取主数据集X_train.txt和X_test.txt的列名。 读取训练和测试目录中的每个数据集。 为每个数据集分配适当的列名称。 合并数据集: 使用rbind合并X,Y和subject_id数据集进行测试和训练。 由于X数据集的列名不合适,因此请将其更改为有效名称,以供将来使用。 选择特定的列: 使用选择和匹配功能选择具有“均值”和“标准”的列。 为了跳过在列名中也带有“ mean”和“ std”的“ meanFreq”和“ angle”,我使用-match跳过了它们。 使用mutate函数添加活动列和subject_id作为因素。 分组: 使用group_by函数将数据与subject_id和活动进行分组。 ##总结: 使用summarise_each函数可
【文件预览】:
Samsung_data_cleaning-master
----run_analysis.R(2KB)
----README.md(1KB)
----codebook.md(1KB)