文件名称:cleaningDataPrj:Coursera的获取和清洁数据课程的(个人)课程项目,Jeff Leek博士,Roger D. Peng博士,Brian Caffo博士
文件大小:3KB
文件格式:ZIP
更新时间:2024-06-17 12:33:33
R
cleaningDataPrj Coursera的获取和清洁数据课程的(个人)课程项目,Jeff Leek博士,Roger D. Peng博士,Brian Caffo博士 该存储库包含R脚本(“ run_analysis.R”),并带有代码,以根据分配的说明从提议的“原始”数据集中获取最终的整齐数据集。 脚本如何工作 它首先加载dplyr库,该库的功能对于此分配特别有用。 然后,如准则中所述: 步骤1:将训练集和测试集合并以创建一个数据集。 识别数据集中的特征 使用具有参数“优化”配置的read.table()读取与那些功能相对应的度量以及相应的主题和活动。 用于训练和测试数据集。 就行和列而言,将那些导入的数据集“粘合”到单个数据集中。 在其中创建一个tbl对象(dplyr)并清除内存。 步骤2:仅提取每次测量的平均值和标准偏差的测量值。 使用正则表达式,选择所有包含“ mea
【文件预览】:
cleaningDataPrj-master
----README.md(3KB)
----run_analysis.R(4KB)