RF_map_reduce_R:R中具有mapReduce函数的hadoop流中的半可扩展随机森林选择

时间:2024-06-25 07:20:13
【文件属性】:

文件名称:RF_map_reduce_R:R中具有mapReduce函数的hadoop流中的半可扩展随机森林选择

文件大小:128KB

文件格式:ZIP

更新时间:2024-06-25 07:20:13

R

R中具有mapReduce函数的hadoop流中的半可扩展随机森林选择 随机森林是由 Leo Breiman 和 Adele Cutler 开发的机器学习模型和特征选择。 按照他们网站上的描述( ): “我们假设用户知道单个分类树的构造。随机森林生长许多分类树。要从输入向量中对新对象进行分类,请将输入向量放在森林中的每棵树下。每棵树给出一个分类,我们说树为那个类“投票”。森林选择投票最多的分类(在森林中的所有树中)。 每棵树的生长过程如下: 如果训练集中的案例数为 N,则从原始数据中随机抽取 N 个案例 - 但进行替换。 该样本将是用于生长树的训练集。 如果有 M 个输入变量,则指定一个数字 m<<M,以便在每个节点上,从 M 个变量中随机选择 m 个变量,并使用这些 m 上的最佳分裂来分裂节点。 m 的值在森林生长期间保持不变。 每棵树都尽可能地生长。 没有修剪。 在关于随机森林


【文件预览】:
RF_map_reduce_R-master
----.gitignore(574B)
----reducer.R(2KB)
----aggregate.R(365B)
----maper.R(663B)
----spambase_names.csv(914B)
----README.md(2KB)
----run.sh(528B)
----spambase.csv(682KB)
----.gitattributes(378B)

网友评论