文件名称:实验内容-二相编码信号性能分析
文件大小:3.19MB
文件格式:PDF
更新时间:2024-07-05 06:18:18
2017年学习
第一章 实验介绍 1.1 实验内容 本人在二选一的实验内容中选择实验一:网站用户行为分析,该实验手 册由厦门大学数据库实验室团队编写,旨在锻炼学生在大数据学习过程中对 大数据原理及技术应用能力。本案例涉及数据预处理、存储、查询和可视化 分析等数据处理全流程所涉及的各种典型操作,涵盖 Linux、MySQL、Hadoop、 HBase、Hive、Sqoop、R、Eclipse 等系统和软件的安装和使用方法。实际完 成的实验任务有: 安装 Linux 操作系统; 安装关系型数据库 MySQL; 安装大数据处理框架 Hadoop; 安装列族数据库 HBase; 安装数据仓库 Hive; 安装 Sqoop; 安装 R; 安装 Eclipse; 对文本文件形式的原始数据集进行预处理; 把文本文件的数据集导入到数据仓库 Hive 中; 对数据仓库 Hive 中的数据进行查询分析; 使用 Sqoop 将数据从 Hive 导入 MySQL; 使用 Sqoop 将数据从 MySQL 导入 HBase; 使用 HBase Java API 把数据从本地导入到 HBase 中; 使用 R 对 MySQL 中的数据进行可视化分析;