文件名称:datasciencecoursera:Coursera 的数据科学课程
文件大小:58.21MB
文件格式:ZIP
更新时间:2024-07-07 04:51:11
R
获取和清理数据 课程项目 您应该创建一个名为 run_analysis.R 的 R 脚本来执行以下操作。 合并训练集和测试集以创建一个数据集。 仅提取每个测量值的平均值和标准偏差的测量值。 使用描述性活动名称来命名数据集中的活动 使用描述性活动名称适当地标记数据集。 使用每个活动和每个主题的每个变量的平均值创建第二个独立的整洁数据集。 完成本课程项目的步骤 下载数据源并将其放入本地驱动器上的文件夹中。 您将拥有一个UCI HAR Dataset文件夹。 将run_analysis.R放在UCI HAR Dataset的父文件夹中,然后使用 RStudio 中的setwd()函数将其设置为您的工作目录。 运行source("run_analysis.R") ,然后它将在您的工作目录中生成一个新文件tiny_data.txt 。 使用的图书馆 你应该安装了 data.table 和
【文件预览】:
datasciencecoursera-master
----CourseProject.docx(19KB)
----CodeBook.md(4KB)
----tidy_data.txt(262KB)
----UCI HAR Dataset()
--------features_info.txt(3KB)
--------features.txt(15KB)
--------activity_labels.txt(80B)
--------README.txt(4KB)
--------train()
--------test()
----README.md(1KB)
----HelloWorld.md(26B)
----run_analysis.R(2KB)
----.gitattributes(483B)