pydata_berlin:PyData 聚会 11112014

时间:2024-08-03 00:38:39
【文件属性】:

文件名称:pydata_berlin:PyData 聚会 11112014

文件大小:20.06MB

文件格式:ZIP

更新时间:2024-08-03 00:38:39

PyData 柏林聚会 PyData 聚会 11/11/2014 PySpark 演讲的幻灯片和 Python 笔记本。 要开始下载 Spark,请设置环境变量并启动笔记本。 export SPARK_HOME=""; export PYTHONPATH="$SPARK_HOME/python/:$PYTHONPATH"; 数据是原始数据集的一个小子样本:“亚马逊电影评论”: :


【文件预览】:
pydata_berlin-master
----pyspark_pydata_berlin.ipynb(106KB)
----README.md(515B)
----data()
--------movies.json(54.58MB)
----.gitignore(675B)
----pyspark_pydata_berlin.pdf(360KB)

网友评论