文件名称:spark-mrmr-feature-selection:Spark MlLib 的机器学习增强功能
文件大小:8KB
文件格式:ZIP
更新时间:2024-07-08 00:17:06
Scala
火花-毫升 Spark MlLib 的机器学习增强功能 基于Maximum-Relevance Minimum-Redundancy的FeatureSelection(通过信息增益衡量的特征的重要性) 用法: MrMrFeatureSelection(vectorModelRDD, labelBuckets, featuresBuckets, noRecords) vectorModelRDD = LabeledPoint 的 rdd,其中特征类型为 DenseVector labelBuckets = 类型 Array[Double],对应于标签桶; 第一个元素必须小于标签的最小值,最后一个元素必须大于标签的最大值 featuresBuckets = type Array[Array[Double]] featuresBuckets[i] 对应于属于特征的桶数组i(基于输入 rdd
【文件预览】:
spark-mrmr-feature-selection-master
----FeatureSelection.scala(9KB)
----util()
--------BinarySearch.scala(735B)
----LICENSE(10KB)
----README.md(2KB)