Pyspark

时间:2021-03-17 02:17:36
【文件属性】:
文件名称:Pyspark
文件大小:956KB
文件格式:ZIP
更新时间:2021-03-17 02:17:36
JupyterNotebook 大数据的Python和火花 适用于Python的课程笔记本和适用于大数据的Spark 课程大纲: 课程介绍 促销/介绍视频 课程大纲 Spark,RDD和Spark 2.0简介 课程设置 设置概述 EC2安装指南 VirtualBox的本地安装指南 Databricks笔记本 Unix命令行基础知识和Jupyter Notebook概述 Spark DataFrames Spark DataFrames部分介绍 Spark DataFrame基础 Spark DataFrame操作 分组和汇总功能 缺失数据 日期和时间戳 Spark DataFrame项目 DataFrame项目练习 DataFrame项目练习解决方案 机器学习 机器学习和ISLR简介 使用Spark和Python和MLlib进行机器学习 咨询项目方法概述 线性回归 线性回归简介 讨论数据转换 带有PySpark示例
【文件预览】:
Pyspark-main
----Python_intro()
--------Python Crash Course Exercises.ipynb(8KB)
--------Readme.md(1B)
--------Python Crash Course.ipynb(34KB)
--------Python Crash Course Exercises - Solutions.ipynb(9KB)
----Installation Lectures.pdf(450KB)
----README.md(2KB)
----Spark Overview.pdf(575KB)
----Pyspark_DataFrame()
--------Dates_and_Timestamps.ipynb(16KB)
--------appl_stock.csv(140KB)
--------Readme.md(1B)
--------ContainsNull.csv(61B)
--------people.json(73B)
--------DataFrame_Basics.ipynb(20KB)
--------Missing_Data.ipynb(10KB)
--------GroupBy_and_Aggregate_Functions.ipynb(14KB)
--------sales_info.csv(196B)
--------DataFrame_Basic_Operations.ipynb(24KB)
----Pyspark_ML()
--------Readme.md(1B)
--------Regression()

网友评论