文件名称:随机森林-人脸识别图像预处理技术
文件大小:4.91MB
文件格式:PDF
更新时间:2024-06-29 11:23:49
数据挖掘算法 Python
5.8 随机森林
1.概念:随机森林利用随机的方式将许多决策树组合成一个森林,每个决策树在分类的时候决定测试
样本的最终类别
2.随机森林简介
3. Python 实现
#Import Lib
From sklearn.ensemble import RandomForestClassifier
#use RandomForestRegressor for regression problem
#Assumed you have, X (predictor) and Y (target) for training data set and x_test(predictor) of test_dataset
# Create Random Forest object
model= RandomForestClassifier(n_estimators=1000)
# Train the model using the training sets and check score
model.fit(X, y)
#Predict Output
predicted= model.predict(x_test)
随机森林
1.随机选择
样本
给定训练样本集,数量为N,有放回采样
到N个样本(会重复)
2.随机选择
特征
总量为M的特征向量中,随机选择(无放回)m个特征没然后
计算m个特征的增益(m