随机森林可视化

时间:2022-11-07 11:59:20

今天看到别人的文章,说到了随机森林可视化,于是尝试了下。

window安装

windows版本安装:
1.在下面去下载window的exe安装包,安装graphviz。

http://www.graphviz.org/download/
在路径选项,点击add path to computer,然后后面全部点确定就行。安装好以后,打开powershell,输入dot -version,就可以看到安装成功了。
2.安装pygraphviz和pybaobabdt

# 安装pygraphviz
conda install --channel conda-forge pygraphviz
# 安装pybaobabdt
pip install pybaobabdt
pybaobabdt.drawTree(decisionTreeClassifier, features=[], model=[], colormap='viridis', size=15, dpi=300, ratio=1, classes=[], maxdepth=-1, ax=-1)

linux安装

sudo apt-get install graphviz graphviz-dev
vim ~/.bashrc

conda install --channel conda-forge pygraphviz
pip install pybaobabdt

主要是使用Pybaobabdt来绘制决策树。

展示

下面这个是官网作者的图
随机森林可视化
这是我的数据的图:
随机森林可视化
不得不说,,,这个图也太丑了点,虽然用的是默认的决策树超参数。。。

DecisionTree( criterion=‘gini’, splitter=‘best’, max_depth=None, min_samples_split=2, min_samples_leaf=1, min_weight_fraction_leaf=0.0, max_features=None, random_state=None, max_leaf_nodes=None, min_impurity_decrease=0.0, class_weight=None, ccp_alpha=0.0)

max_depth = 10 max_depth = 3
随机森林可视化
随机森林可视化

我这个数据由于特征值太小,所以默认的决策树生长到5层就不生长了。所以max_depth参数只在1-5之间才有用。这加深了我对树类模型的调参认识。

from matplotlib.colors import ListedColormap
colors = ["gray", "purple"]
colormap = ListedColormap(colors)
pybaobabdt.drawTree(clf, size=10, dpi=72, features=features, colormap=colormap)

随机森林可视化

Usage

pybaobabdt.drawTree(decisionTreeClassifier, features=[], model=[], colormap='viridis', size=15, dpi=300, ratio=1, classes=[], maxdepth=-1, ax=-1)

这个ratio用来控制字符显示大小,maxdepth用来控制树的显示,可以选择只显示顶端5行。

随机森林用法

随机森林可以选择只显示其中一棵树

clf = RandomForestClassifier(n_estimators=20).fit(data, label)
pybaobabdt.drawTree(clf.estimators_[0], size=10, dpi=300, features=features)