文件名称:Machine-Learning-with-Spark-Second-Edition:Spark机器学习第二版源代码-机器学习
文件大小:125.11MB
文件格式:ZIP
更新时间:2024-04-13 12:58:46
系统开源
使用Spark进行机器学习-第二版 这是发行的的代码存储库。 它包含从头到尾完成本书所必需的所有支持项目文件。 关于这本书 本书将教您流行的机器学习算法及其实现。 您将学习如何在Spark ML上下文中实现各种机器学习概念。 您将首先在单节点和多节点群集中安装Spark。 接下来,您将看到如何为Spark ML执行基于Scala和Python的程序。 然后,我们将获取一些数据集,并进一步进行聚类,分类和回归。 最后,我们还将介绍使用Spark ML进行文本处理。 说明和导航 所有代码都组织在文件夹中。 每个文件夹均以数字开头,后跟应用程序名称。 例如,Chapter02。 第03章不包含代码文件。 该代码将如下所示: val conf = new SparkConf() .setAppName("Test Spark App") .setMaster("local[4]") val