【文件属性】:
文件名称:Pyspark
文件大小:956KB
文件格式:ZIP
更新时间:2021-03-17 02:17:36
JupyterNotebook
大数据的Python和火花
适用于Python的课程笔记本和适用于大数据的Spark
课程大纲:
课程介绍
促销/介绍视频
课程大纲
Spark,RDD和Spark 2.0简介
课程设置
设置概述
EC2安装指南
VirtualBox的本地安装指南
Databricks笔记本
Unix命令行基础知识和Jupyter Notebook概述
Spark DataFrames
Spark DataFrames部分介绍
Spark DataFrame基础
Spark DataFrame操作
分组和汇总功能
缺失数据
日期和时间戳
Spark DataFrame项目
DataFrame项目练习
DataFrame项目练习解决方案
机器学习
机器学习和ISLR简介
使用Spark和Python和MLlib进行机器学习
咨询项目方法概述
线性回归
线性回归简介
讨论数据转换
带有PySpark示例
【文件预览】:
Pyspark-main
----Python_intro()
--------Python Crash Course Exercises.ipynb(8KB)
--------Readme.md(1B)
--------Python Crash Course.ipynb(34KB)
--------Python Crash Course Exercises - Solutions.ipynb(9KB)
----Installation Lectures.pdf(450KB)
----README.md(2KB)
----Spark Overview.pdf(575KB)
----Pyspark_DataFrame()
--------Dates_and_Timestamps.ipynb(16KB)
--------appl_stock.csv(140KB)
--------Readme.md(1B)
--------ContainsNull.csv(61B)
--------people.json(73B)
--------DataFrame_Basics.ipynb(20KB)
--------Missing_Data.ipynb(10KB)
--------GroupBy_and_Aggregate_Functions.ipynb(14KB)
--------sales_info.csv(196B)
--------DataFrame_Basic_Operations.ipynb(24KB)
----Pyspark_ML()
--------Readme.md(1B)
--------Regression()