ObjectT5：在线随机森林-Multi-Forest-A chameleon in track in

原文：：Multi-Forest：A chameleon in tracking，CVPR2014 下的蛋...原文

使用随机森林的优势，在于可以使用GPU把每棵树分到一个流处理器里运行，容易并行化实现。

OpenCV中的使用：OpenCV：使用随机森林与GBDT

（1）:在线Boost

使用Haar特征树作为弱分类器，取得不错的效果。但是速度稍慢。

（2）:在线随机森林：

09年，ICCV 上的文章，效果和离线的random
forest差不多，特别的牛。可以做分类，也可以做预测....

这里介绍的主要是在线随机决策树，其思想主要是：每棵树可以在线分裂。每个叶子分裂的条件是预测的数量要达到一定的值和每个叶子节点信息。

每个树的生长主要通过预测的样本（在线接受的样本），每棵树的叶子节点分裂主要根据该节点的熵或Gini

ObjectT5：在线随机森林-Multi-Forest-A chameleon in track in or

学过决策树和信息论的，对这个概念都有了解。其中j表示第j棵树，i表示第i个分类结果。K表示总的分类数。

对有一个给定的结合S（在线预测中给定），每棵树上叶子节点P_j的的概率可以表示为：

ObjectT5：在线随机森林-Multi-Forest-A chameleon in track in

如果要在P_j叶子节点分类，那么，得到二个叶子节点的概率可以用下式表示：

ObjectT5：在线随机森林-Multi-Forest-A chameleon in track in
and

解释一下 P_jls，l为left，s为测试集合。所以P_jls表示为在集合S中P_j叶子节点的分列的左节点。同理，P_jrs表示为在集合S中P_j叶子节点的分列的右节点。

那么，每棵树上叶子节点P_j分裂必须符合以下二个条件：

1. 落在叶子节点P_j的个数必须大于一个常数（可以人工设定）

2. 叶子节点的Gini必须大于一个常数（可以人工设定），Gini计算公式如下：

ObjectT5：在线随机森林-Multi-Forest-A chameleon in track in

以上步骤就完成整个树的更新。

步骤3. 用个possion分布确定从采样的次数，其原理见online boosting： http://www.cnblogs.com/liqizhou/archive/2012/05/10/2494145.html

步骤6. u代表分类的类别。

步骤7. j代表第t棵树上叶子节点。

步骤8. 统计第j个叶子节点的数目和计算Gini

步骤9. 判断条件是否分裂的二个条件。

步骤10. 在符合条件的叶子节点中，选择一个Gini最大的叶子节点作为分类节点。

以上就是online Random forests 的主要思想

下面给出了在线随机森林算法的流程：

ObjectT5：在线随机森林-Multi-Forest-A chameleon in track in

待写....

秒客网