文件名称:Frank-Kanes-Taming-Big-Data-with-Apache-Spark-and-Python:弗兰克·凯恩(Frank Kane)用Apache Spark和Python驯服大数据,由Packt发布
文件大小:925KB
文件格式:ZIP
更新时间:2024-06-17 05:40:24
Python
弗兰克·凯恩(Frank Kane)用Apache Spark和Python驯服大数据 这是出版的的代码库。 它包含从头到尾完成本书所必需的所有支持项目文件。 关于这本书 弗兰克·凯恩(Frank Kane)通过Apache Spark和Python驯服大数据是您动手学习Apache Spark的伴侣。 Frank将通过教您如何在单个系统或集群上设置Spark来开始您的学习,您将很快开始使用Spark RDD分析大型数据集,并使用Python快速开发和运行有效的Spark作业。 Apache Spark已成为大数据领域中的下一个重要事物–在短短几年内从上升的技术Swift崛起为知名的超级巨星。 Spark使您可以实时地从大量数据中快速提取可行的见解,使其成为许多现代企业中必不可少的工具。 弗兰克(Frank)在本书中包装了超过15个与现实世界相关的有趣有趣的交互式示例,他将使您能够了解
【文件预览】:
Frank-Kanes-Taming-Big-Data-with-Apache-Spark-and-Python-master
----word-count.py(441B)
----customer-orders.csv(143KB)
----word-count-better.py(539B)
----most-popular-superhero.py(904B)
----fakefriends.csv(9KB)
----ratings-counter.py(452B)
----spark-sql.py(1KB)
----movie-similarities-cluster.py(3KB)
----Marvel-graph.txt(1.6MB)
----movie-similarities.py(3KB)
----Marvel-names.txt(344KB)
----total-spent-by-customer-sorted.py(735B)
----word-count-better-sorted.py(690B)
----regression.txt(12KB)
----min-temperatures.py(739B)
----spark-linear-regression.py(2KB)
----total-spent-by-customer.py(529B)
----popular-movies.py(487B)
----LICENSE(1KB)
----max-temperatures.py(739B)
----movie-recommendations-als-1m.py(1KB)
----1800.csv(61KB)
----degrees-of-separation.py(4KB)
----README.md(3KB)
----movie-similarities-1m.py(4KB)
----friends-by-age.py(618B)
----movie-recommendations-als.py(1KB)
----popular-movies-dataframe.py(1KB)
----popular-movies-nicer.py(862B)
----book.txt(259KB)