文件名称:DataScienceGettingAndCleaningProject:数据科学证书课程的回购获取和清理数据
文件大小:121KB
文件格式:ZIP
更新时间:2024-07-13 01:36:30
R
###这是数据科学课程“获取和清理数据”的第三周项目的 GitHub 存储库。 它包含一个脚本“run_analysis.R”,它从源 [1] 获取数据并根据项目问题陈述处理它,生成文件“step_5_tidy_data.txt”中的输出整齐数据集。 脚本的输出数据集(“step_5_tidy_data.txt”)的格式在文件“CodeBook.md”中描述。 大体上脚本的操作是: 使用 [2] 中的 URL 下载数据集的 .zip 文件。 将文件 activity_labels.txt 读入数据框 activity_labels.df 。 将文件 features.txt 读入数据框 features_df 。 将一列添加到 features_df 并更正特征名称以允许它们用作数据框列名称。 使用 make.names() 重命名任何重复的功能名称以确保唯一的功能名称。
【文件预览】:
DataScienceGettingAndCleaningProject-master
----.gitignore(146B)
----step_5_tidy_data.txt(285KB)
----CodeBook.md(14KB)
----README.md(2KB)
----run_analysis.R(8KB)
----.gitattributes(378B)