RF & Microarray时间:2023-03-09 02:09:19 REF[24] 随机森林是一个很好适用于微阵列数据的分类算法: 1.即使大多数的预测变量都是噪音,RF仍然具有优秀的性能,因此不需要对基因进行预选择。 2.能够应用于变量数远远大于观测数据量的情况 3.能用于两类和多于两个分类问题的情况 4.返回变量重要性测量 5.不会过拟合 6.能处理分类和连续预测器的混合 7.合并预测变量间的相互作用 8.对于预测器的单调变换,输出不变 9.高质量免费的实现,如R包 10.几乎不需要调整参数来获得优秀的性能