文件名称:pyspark-setup-demo:具有Jupyter Docker堆栈的PySpark和Jupyter Notebook演示
文件大小:977KB
文件格式:ZIP
更新时间:2024-02-25 01:16:14
python docker big-data jupyter jupyter-notebook
Jupyter Notebook PySpark演示 带有的和演示。 有关该项目的完整信息,请阅读相关博客文章 建筑 建立 从GitHub克隆此项目: git clone \ --branch v2 --single-branch --depth 1 --no-tags \ https://github.com/garystafford/pyspark-setup-demo.git 为PostgreSQL文件创建$HOME/data/postgres目录: mkdir -p ~/data/postgres 可选,要进行本地开发,请安装Python软件包: python3
【文件预览】:
pyspark-setup-demo-2
----stack-nbext.yml(1KB)
----work()
--------postgresql-42.2.10.jar(906KB)
--------05_notebook.ipynb(11KB)
--------log4j.properties(275B)
--------BreadBasket_DMS.csv(694KB)
--------02_pyspark_job.py(678B)
--------01_simple_script.py(293B)
--------04_notebook.ipynb(79KB)
--------bootstrap_jupyter.sh(593B)
--------requirements.txt(67B)
--------03_load_sql.py(904B)
--------bakery.sql(620B)
----LICENSE(1KB)
----.gitignore(135B)
----docker_nbextensions()
--------Dockerfile(398B)
--------docker.txt(62B)
----README.md(3KB)
----stack.yml(1KB)