文件名称:cleaning-data:Coursera 项目
文件大小:3KB
文件格式:ZIP
更新时间:2024-07-13 01:43:34
R
清理数据 Coursera 项目 这是我向 Coursera 项目的获取和清理数据提交的内容 只有一个 R 脚本,它非常简单,提取、转换和加载(ETL 经典过程)。 要加载的文件是由“”分隔的文本文件,没有空格,(我有一些问题要发现。 将数据加载到主内存中后,我使用 rbind 将 x_files 和 y_files 结合起来进行训练和测试。 以同样的方式我联合 subject_test 和 subject_train 对于特征,我们只需要选择均值和标准差方面,所以我使用正则表达式来做到这一点。 以相同的方式擦除括号和其他无字母数字符号,我使用了 grep。 最后,我使用 gsub 将 – 符号更改为 _ 符号,再一次借助正则表达式。 对于活动标签,我使用合并以便在最终文件中创建一个新列 为了获得列的平均值,我使用了 aggraget.dat.frame 以便首先对主题和活动名称进
【文件预览】:
cleaning-data-master
----CodeBook.md(3KB)
----run_analysis.R(3KB)
----README.md(1KB)