文件名称:case_pyspark:基于Python语言的Spark数据处理分析案例集锦(PySpark)
文件大小:7.04MB
文件格式:ZIP
更新时间:2024-06-08 22:06:11
HTML
case_pyspark 基于Python语言的Spark数据处理分析案例集锦(PySpark) 实验环境 1) Linux: Ubuntu 20.04 2) Python: 3.7.x 3) Spark: 2.4.5(安装教程: 4) Jupyter Notebook: (安装教程和使用方法: 案例 1) yelp: 基于YELP数据集的商业数据分析 2) us_counties: 2020年美国新冠肺炎疫情数据分析 3) ECommerce: 基于零售交易数据的Spark数据处理与分析 4) earthquake: 基于地震数据的Spark数据处理与分析 5) global: 基于Spark的地震数据处理与分析 6) OverDue: 基于信用卡逾期数据的Spark数据处理与分析 7) project: 基于 TMDB 数据集的电影数据分析
【文件预览】:
case_pyspark-main
----project()
--------lang.html(1KB)
--------index.html(6KB)
--------.DS_Store(10KB)
--------budget_vote.html(2KB)
--------date_vote.html(2KB)
--------web.py(357B)
--------analyst.py(5KB)
--------keywords.html(3KB)
--------run.sh(118B)
--------input()
--------budget_revenue.html(2KB)
--------pop_vote.html(2KB)
--------runtime.html(2KB)
--------README.md(2KB)
--------genres.html(2KB)
--------budget.html(2KB)
--------company_count.html(2KB)
--------movies_vote.html(2KB)
--------static()
--------fields.json(323B)
----OverDue()
--------realestateLoans_OverDue.html(15KB)
--------data_preprocessing.py(583B)
--------age_OverDue.html(28KB)
--------README.md(4KB)
--------data_analysis.py(6KB)
--------data_web.py(11KB)
--------__pycache__()
--------data()
--------families_OverDue.html(15KB)
--------pastDue_OverDue.html(19KB)
--------meanIncome_OverDue.html(15KB)
----global()
--------preprocessing.py(2KB)
--------analyze.py(3KB)
--------README.md(969B)
--------data()
----yelp()
--------business_analysis.py(4KB)
--------business_process.py(2KB)
--------business_visual.py(4KB)
--------README.md(2KB)
----us_counties()
--------analyst.py(4KB)
--------README.md(99B)
--------showdata.py(9KB)
--------data_change.py(434B)
----ECommerce()
--------index.html(6KB)
--------web.py(385B)
--------buyReturn.html(2KB)
--------countryReturnInvoice.html(2KB)
--------countrySumOfPrice.html(2KB)
--------countryCustomer.html(2KB)
--------wordCount.html(16KB)
--------stockQuantity.html(2KB)
--------saleQuantity.html(2KB)
--------tradePrice.html(2KB)
--------unitPriceSales.html(2KB)
--------countryQuantity.html(2KB)
--------project.py(6KB)
--------static()
----earthquake()
--------README.md(271B)
--------earthquake_visualization.py(7KB)
--------earthquake_analyse.py(3KB)
----README.md(795B)
----.gitignore(270B)