文件名称:pyspark-tutorial:在 Red Hat Storage GlusterFS 上部署 Anaconda Cluster 和 PySpark 的教程
文件大小:109KB
文件格式:ZIP
更新时间:2024-07-15 00:19:22
Python
pyspark-教程 本教程介绍了如何在 Red Hat Storage GlusterFS 之上部署 Anaconda Cluster 和 PySpark。 先决条件 您首先需要一个 GlusterFS 集群。 您可以从 Red Hat 获得商业版本,也可以使用。 在您的 GlusterFS 集群中指定一个随机节点作为您的 Anaconda 集群主节点。 从主节点,设置对集群中其他 GlusterFS 节点和自身的无密码 SSH 访问。 在您的客户端(笔记本电脑)上安装 Anaconda 在可以访问集群的笔记本电脑(或客户端机器)上安装 Anaconda 2.7。 你可以。 在您的客户端(笔记本电脑)上安装 Anaconda Cluster 可以通过联系 Continuum Analytics 获取 Anaconda Cluster 的许可证令牌。 获得令牌后,可以通过在客户端计算
【文件预览】:
pyspark-tutorial-master
----solution.png(115KB)
----spark-wordcount.py(489B)
----README.md(4KB)