文件名称:Mastering-Machine-Learning-with-Spark-2.x:Packt发行的Spark 2.x精通机器学习
文件大小:601KB
文件格式:ZIP
更新时间:2024-06-17 06:04:48
Scala
使用Spark 2.x掌握机器学习 这是出版的的代码库。 它包含从头到尾完成本书所必需的所有支持项目文件。 关于这本书 这本书使您可以将数据转换为可操作的知识。 本书首先通过MLlib和H2O库定义机器学习原语开始。 您将学习如何使用二元分类法来检测CERN粒子对撞机产生的大量数据中的希格斯玻色子粒子,或使用集合方法对日常健康活动进行分类。 说明和导航 所有代码都组织在文件夹中。 每个文件夹均以数字开头,后跟应用程序名称。 例如,Chapter02。 该存储库包括以下章节: 第2章:检测暗物质-希格斯玻色子粒子 第三章:用于多类分类的集合方法 第4章:使用NLP和Spark流预测电影评论 第5章:用于预测和聚类的Word2Vec 第6章:从Clickstream数据中提取模式 第7章:使用GraphX进行图分析 第8章:贷款俱乐部贷款预测 注意:第01章不包含代码。 本书提供的代码