文件名称:cuny_msda_is622:CUNY MS Data Anayltics课程IS622大数据与机器学习的资源
文件大小:52KB
文件格式:ZIP
更新时间:2024-05-19 08:53:07
Shell
概述 该脚本为基于debianLinux系统设置了完整的Hadoop和Spark环境。 它还安装了关联的R绑定,以直接从R运行这些系统。请注意,它假定使用的是新环境,因此,如果您有现有Linux系统,则应查看脚本并注释掉不想运行的部分。 如果没有可用Linux计算机,则可以选择在虚拟机上安装Linux或使用托管的云提供程序。 我建议安装。 RHadoop 安装 步骤1:安装Hadoop和Spark 脚本setup_reqs.sh installs a bunch of dependencies and下载Hadoop和Spark。 如果您有一个预先存在的系统,请检查相关性以确保与您的配置没有冲突。 ./setup_reqs.sh 安装遵循本描述的单个本地实例的过程。 该教程建议使用~/Programs作为安装,而脚本使用~/workspace/cuny_msda_is622 。 注
【文件预览】:
cuny_msda_is622-master
----.gitignore(173B)
----README.md(5KB)
----bin()
--------start_all.sh(480B)
----LICENSE(1KB)
----setup_rhadoop.sh(621B)
----R()
--------matrix.R(487B)
--------mapreduce.R(1KB)
--------wordcount.R(243B)
----setup_reqs.sh(2KB)
----homework.Rmd(363B)
----data()
--------amazon_10q.txt(158KB)