pyspark

时间:2021-03-08 17:27:25
【文件属性】:
文件名称:pyspark
文件大小:4.35MB
文件格式:ZIP
更新时间:2021-03-08 17:27:25
JupyterNotebook pyspark 该存储库专用于pyspark的代码段。 该代码已针对为Hadoop 2.7.3构建的Spark 2.4.6进行了测试。 注意:为了通过pyspark连接到Mongodb,您需要其他jar文件,具体取决于您使用的spark版本。 有用链接:
【文件预览】:
pyspark-main
----Basic Spark Code.ipynb(31KB)
----people.json(73B)
----mysql-connector-java-5.1.49-bin.jar(983KB)
----mongo-java-driver-3.9.0.jar(1.97MB)
----mysql-connector-java-5.1.49.jar(983KB)
----connectToMongodb.py(831B)
----mongo-spark-connector_2.11-2.4.2.jar(841KB)
----README.md(969B)

网友评论