有了训练集我们就可以训练模型了。-Spark MLlib决策树

时间:2024-05-14 17:40:35
【文件属性】:

文件名称:有了训练集我们就可以训练模型了。-Spark MLlib决策树

文件大小:273KB

文件格式:PPT

更新时间:2024-05-14 17:40:35

机器学习 决策树 spark mllib

有了训练集,我们就可以训练模型了。 trainingData:训练集 numClasses:分类数目 categoricalFeaturesInfo:输入数据的格式 impurity:信息增益计算方式 maxDepth:树的高度 maxBins:分裂数据集 spark的决策树对label的定义是从0开始的。所以,虽然我们这里是1,2,3,4,5这五 种标签,但在spark的决策树看来,其实是6种。 categoricalFeaturesInfo这个参数表示了有哪些特征的值是离散的(不表明的都会当 成连续的),以及其有多少种特征值。同样要注意的是,特征值也是从0开始计数, 并且是连续不间断的。


网友评论