文件名称:cleaningdata:获取和清理数据课程项目
文件大小:88KB
文件格式:ZIP
更新时间:2024-06-15 16:55:52
R
获取和清理数据课程项目 本文介绍了脚本“ run_analysis.R”的工作方式。 获取数据 zip归档文件是手动下载和提取的。 包含解压缩后的文本文件的目录已移至R的工作目录。 读取数据 首先打开所有文本文件,然后使用文本编辑器进行查看。 第一步,脚本使用功能“ read.table()”从工作目录中读取所有需要的文件以及原始数据,并将每个数据集分配给单独的数据帧。 此处,来自软件包“ dplyr”的函数tbl_df()用于根据主数据集X_test和X_train创建特殊数据帧。 计算主数据框 随后,这两个数据帧与功能bind_row()合并,并分配给一个称为“ dt_test_train”的新数据帧。 从文本文件“ feature.txt”读取的变量名称被分配给数据框“ dt_test_train”作为列名。 使用函数select_vars()提取名称为“ -mean()”或“ -
【文件预览】:
cleaningdata-master
----.gitignore(173B)
----codeBook.md(3KB)
----datafile.txt(219KB)
----README.md(2KB)
----run_analysis.R(4KB)