ML之PDP:基于FIFA 2018 Statistics(2018年俄罗斯世界杯足球赛)球队比赛之星分类预测数据集利用DT决策树&RF随机森林+PDP部分依赖图可视化实现模型可解释性之详细攻略
目录
基于FIFA 2018 Statistics(2018年俄罗斯世界杯足球赛)球队比赛之星分类预测数据集利用DT决策树&RF随机森林+PDP部分依赖图可视化实现模型可解释性
# 1、定义数据集
# 2、数据预处理
# 2.1、分离特征与标签
# 3、模型建立和训练
# 3.1、数据集切分# 3.2、模型训练
# 3.3、树模型可视化并保存图片
# 3.4、PDP可视化
# (1)、单特征PDP可视化
# (2)、双特征交互PDP可视化
相关文章
ML:机器学习可解释性之部分依赖图之每个特征如何影响您的预测?ML之PDP:基于FIFA 2018 Statistics(2018年俄罗斯世界杯足球赛)球队比赛之星分类预测数据集利用DT决策树&RF随机森林+PDP部分依赖图可视化实现模型可解释性之详细攻略
ML之PDP:基于FIFA 2018 Statistics(2018年俄罗斯世界杯足球赛)球队比赛之星分类预测数据集利用DT决策树&RF随机森林+PDP部分依赖图可视化实现模型可解释性之详细攻略实现
基于FIFA 2018 Statistics(2018年俄罗斯世界杯足球赛)球队比赛之星分类预测数据集利用DT决策树&RF随机森林+PDP部分依赖图可视化实现模型可解释性
# 1、定义数据集
数据集来源:Dataset:FIFA 2018 Statistics数据集(Predict FIFA 2018 Man of the Match预测2018年国际足联最佳球员)的简介、下载、使用方法之详细攻略_一个处女座的程序猿的博客
Date |
Team |
Opponent |
Goal Scored |
Ball Possession % |
Attempts |
On-Target |
Off-Target |
Blocked |
Corners |
Offsides |
Free Kicks |
Saves |
Pass Accuracy % |
Passes |
Distance Covered (Kms) |
Fouls Committed |
Yellow Card |
Yellow & Red |
Red |
Man of the Match |
1st Goal |
Round |
PSO |
Goals in PSO |
Own goals |
Own goal Time |
14-06-2018 |
Russia |
Saudi Arabia |
5 |
40 |
13 |
7 |
3 |
3 |
6 |
3 |
11 |
0 |
78 |
306 |
118 |
22 |
0 |
0 |
0 |
Yes |
12 |
Group Stage |
No |
0 |
||
14-06-2018 |
Saudi Arabia |
Russia |
0 |
60 |
6 |
0 |
3 |
3 |
2 |
1 |
25 |
2 |
86 |
511 |
105 |
10 |
0 |
0 |
0 |
No |
Group Stage |
No |
0 |
|||
15-06-2018 |
Egypt |
Uruguay |
0 |
43 |
8 |
3 |
3 |
2 |
0 |
1 |
7 |
3 |
78 |
395 |
112 |
12 |
2 |
0 |
0 |
No |
Group Stage |
No |
0 |
|||
15-06-2018 |
Uruguay |
Egypt |
1 |
57 |
14 |
4 |
6 |
4 |
5 |
1 |
13 |
3 |
86 |
589 |
111 |
6 |
0 |
0 |
0 |
Yes |
89 |
Group Stage |
No |
0 |
||
15-06-2018 |
Morocco |
Iran |
0 |
64 |
13 |
3 |
6 |
4 |
5 |
0 |
14 |
2 |
86 |
433 |
101 |
22 |
1 |
0 |
0 |
No |
Group Stage |
No |
0 |
1 |
90 |
# 2、数据预处理
# 2.1、分离特征与标签
# 3、模型建立和训练
# 3.1、数据集切分
# 3.2、模型训练
# 3.3、树模型可视化并保存图片
# 将dot数据保存为图片
# 3.4、PDP可视化
# (1)、单特征PDP可视化