文件名称:SparkSMOTE:Spark中实现的综合少数族裔过采样技术(SMOTE)
文件大小:41KB
文件格式:ZIP
更新时间:2024-05-28 12:13:40
Scala
SparkSMOTE 在Spark中实施的综合少数族裔过采样技术(SMOTE) 。 这是处理高度不平衡的数据集的非常有用的方法。 使用细节 入门 编译并运行示例数据(在数据目录中)。 必须指定输入和输出路径(请参阅算法参数)。 sbt compile sbt package ./run 输出文件将包含原始数据集以及SMOTE生成的人工实例。 资料格式 必须从数据中删除任何标题。 第一列对应于数据点的标签(Y)。 剩下的笨拙是功能。 标签必须为0和1。 标签0(Y = 0)对应于多数类示例,标签1(Y = 1)对应于少数类示例。 算法参数 必须在“运行”文件中指定的参数: inputDirectory :训练数据文件的路径。 inputDirectory : SMOTE输出的路径。 numFeatures :数据集中的要素数量。 可以在“运行”文件中指定的参数: K :
【文件预览】:
SparkSMOTE-master
----run(446B)
----src()
--------main()
----LICENSE(1KB)
----build.sbt(440B)
----README.md(2KB)
----data()
--------small_test.txt(96KB)