MSDS694-IoT-sensor-project:分布式计算项目-使用智能手机和智能手表数据进行活动识别

时间:2024-05-04 16:44:16
【文件属性】:

文件名称:MSDS694-IoT-sensor-project:分布式计算项目-使用智能手机和智能手表数据进行活动识别

文件大小:559KB

文件格式:ZIP

更新时间:2024-05-04 16:44:16

JupyterNotebook

关于我 您好,我叫Sophie Wang,我正在旧金山大学获得数据科学硕士学位。 这是我为“分布式计算”课程完成的单个项目。 MSDS694-IoT-传感器-项目 在Apache Spark中使用智能手机和smartwatch数据进行活动识别 在此存储库中,您将找到我所有的python脚本代码以及相应的jupyter笔记本,在其中您可以看到所有打印的中间结果。 项目介绍 使用的数据集来自“ UCI WISDM智能手机和智能手表活动与生物识别”,其中包含智能手机和智能手表的陀螺仪或加速度计收集的信息。 目标是通过在分布式计算环境(SparkML和Spark + H2O)中应用机器学习技术来分类和识别人类活动类别。 该项目包括六个部分(包括EDA和机器学习): 从子文件夹一次加载所有数据作为RDD。 删除所有空值 将RDD转换为Spark数据框 将活动代码数据框与传感器信息数据框结合在一起


【文件预览】:
MSDS694-IoT-sensor-project-main
----.DS_Store(6KB)
----part_4.py(2KB)
----part_5.py(2KB)
----WISDM-dataset-description.pdf(565KB)
----notebooks()
--------.DS_Store(6KB)
--------part_3.ipynb(36KB)
--------part_2.ipynb(53KB)
--------part_4.ipynb(7KB)
--------part_5.ipynb(18KB)
--------part_6.ipynb(15KB)
--------part_1.ipynb(18KB)
----part_6.py(1KB)
----README.md(4KB)
----part_1.py(2KB)
----part_3.py(11KB)
----part_2.py(6KB)

网友评论