spark-mrmr-feature-selection:Spark MlLib 的机器学习增强功能

时间:2024-07-08 00:17:06
【文件属性】:

文件名称:spark-mrmr-feature-selection:Spark MlLib 的机器学习增强功能

文件大小:8KB

文件格式:ZIP

更新时间:2024-07-08 00:17:06

Scala

火花-毫升 Spark MlLib 的机器学习增强功能 基于Maximum-Relevance Minimum-Redundancy的FeatureSelection(通过信息增益衡量的特征的重要性) 用法: MrMrFeatureSelection(vectorModelRDD, labelBuckets, featuresBuckets, noRecords) vectorModelRDD = LabeledPoint 的 rdd,其中特征类型为 DenseVector labelBuckets = 类型 Array[Double],对应于标签桶; 第一个元素必须小于标签的最小值,最后一个元素必须大于标签的最大值 featuresBuckets = type Array[Array[Double]] featuresBuckets[i] 对应于属于特征的桶数组i(基于输入 rdd


【文件预览】:
spark-mrmr-feature-selection-master
----FeatureSelection.scala(9KB)
----util()
--------BinarySearch.scala(735B)
----LICENSE(10KB)
----README.md(2KB)

网友评论