big-data-analytics:大数据分析,由Packt发布

时间:2024-06-17 06:41:16
【文件属性】:
文件名称:big-data-analytics:大数据分析,由Packt发布
文件大小:47KB
文件格式:ZIP
更新时间:2024-06-17 06:41:16
Python #Big Data Analytics这是Packt发布的的代码存储库。 它包含从头到尾完成本书所必需的所有支持项目文件。 ##说明和导航所有代码都组织在文件夹中。 每个文件夹均以数字开头,后跟应用程序名称。 例如,Chapter02。 该代码将如下所示: from pyspark import SparkConf, SparkContext conf = (SparkConf() .setMaster("spark://masterhostname:7077") .setAppName("My Analytical Application") .set("spark.executor.memory", "2g")) sc = SparkContext(conf = conf) 本书中的实践练习在Cloudera,Hortonworks,MapR或预构建的Spark for Hado
【文件预览】:
big-data-analytics-master
----Chapter 8()
--------MahoutShell.scala(3KB)
--------MovieRecommendation.py(7KB)
----Chapter 7()
--------SpamDetection.py(3KB)
--------MLlibDataTypes.py(1KB)
--------MLPipeLine.py(2KB)
--------SpamWords.py(213B)
----Chapter 6()
--------JupyterNotebook.py(667B)
--------HuePysparkNotebook.py(57B)
--------NiFiwithSparkStreaming.sh(4KB)
--------ZeppelinNotebookPySparkandSQL.py(412B)
----Chapter 9()
--------PregelAPI.scala(2KB)
--------InDegreesOutDegrees.scala(615B)
--------GraphTriplets.scala(642B)
--------TriangleCounting.scala(449B)
--------CreatingGraph.scala(2KB)
--------FilteringGraph.scala(551B)
--------JoiningGraphs.scala(1KB)
--------GraphFrames.scala(2KB)
--------CountingGraph.scala(398B)
--------ConnectedComponents.scala(1KB)
--------FlightDataAnalytics.scala(2KB)
--------PageRank.scala(833B)
----Chapter 5()
--------iot_structured_streaming.scala(4KB)
--------hbase_outputformat.py(2KB)
--------network_wordcount.py(791B)
--------direct_kafka_wordcount.py(1KB)
--------streaming_dataframes.scala(544B)
----Chapter 3()
--------WordCount.py(293B)
--------Accumulator.py(137B)
--------PairRDD.py(268B)
--------SystemCommandsOutput.scala(114B)
--------LogAnalytics.py(872B)
--------SystemCommandsReturnCode.scala(133B)
--------BroadCast.py(70B)
--------UnderstandingRDDs.py(1KB)
----LICENSE(1KB)
----Chapter 10()
--------CreateDataFrameJsonParquet.R(505B)
--------SparkRNaiveBayes.R(649B)
--------LocalDF2SparkDF.R(230B)
--------DataFrameswithSparkR.R(3KB)
--------CreateDataFrameHive.R(287B)
--------SparkRKMeans.R(649B)
--------SparkRScript.R(1KB)
--------RStudioSparkR.R(1KB)
----Chapter 4()
--------DataFrames2RDD.py(289B)
--------DataSourceAVRO.py(749B)
--------CreatingDataFramesfromDBs.py(563B)
--------AccessingMetadata.py(316B)
--------CreatingDataFramesfromHive.py(235B)
--------DataSourceCSV.py(547B)
--------DataSourceORC.py(901B)
--------PandasDF2DataFrame.py(462B)
--------DataSourceJDBC.py(1KB)
--------CreatingDataFrames.py(2KB)
--------DataSourceTEXT.py(219B)
--------Datasets2DataFramesViceVersa.py(609B)
--------DataSourceJson.py(662B)
--------CreateDatasets.scala(1007B)
--------DataSourceParquet.py(1KB)
--------DataSourceXML.py(836B)
--------SparkOnHBaseConnector.scala(2KB)
----README.md(3KB)

网友评论