文件名称:rotation-forest-spark::counterclockwise_arrows_button::deciduous_tree::high_voltage:大数据旋转森林
文件大小:1.78MB
文件格式:ZIP
更新时间:2024-04-24 09:31:32
data-mining big-data spark ensemble-learning rotation-forest
大数据旋转森林 Mario Juez-Gil < >,ÁlvarArnaiz-González,JuanJ.Rodríguez,CarlosLópez-Nozal和CésarIgnacioGarcía-Osorio。 联系: 信息工程部布尔戈斯大学布尔戈斯西班牙 抽象的 旋转森林分类器是适用于各种数据挖掘应用程序的成功集成方法。 但是,Rotation Forest通过PCA变换要素空间的方式虽然功能强大,但却会浪费训练和预测时间,因此不适用于大数据。 本文介绍了MapReduce旋转林及其在Spark框架下的实现。 拟议的MapReduce旋转林的行为与标准旋转林相同,在旋转的空间上训练基本分类器,但是使用旋转的功能实现,使其能够在大数据框架中执行。 使用不同的基于云的群集配置可获得实验结果。 贝叶斯测试用于针对大数据的两个集合来验证该方法:随机森林和PCARDE分类器。 我们的提
【文件预览】:
rotation-forest-spark-master
----README.md(3KB)
----rotf-bd()
----.gitmodules(89B)
----LICENSE(35KB)
----experiments.ipynb(2.32MB)
----results()
--------speedup.csv(533B)
--------rotf_variants.csv(106KB)
--------.ipynb_checkpoints()
--------rotf_vs_pcarde_vs_ranf.csv(36KB)