ML之PDP:基于FIFA 2018 Statistics(2018年俄罗斯世界杯足球赛)球队比赛之星分类预测数据集利用DT决策树&RF随机森林+PDP部分依赖图可视化实现模型可解释性之详细攻略

时间:2022-11-15 12:56:05


ML之PDP:基于FIFA 2018 Statistics(2018年俄罗斯世界杯足球赛)球队比赛之星分类预测数据集利用DT决策树&RF随机森林+PDP部分依赖图可视化实现模型可解释性之详细攻略

目录

​​基于FIFA 2018 Statistics(2018年俄罗斯世界杯足球赛)球队比赛之星分类预测数据集利用DT决策树&RF随机森林+PDP部分依赖图可视化实现模型可解释性​​

​​# 1、定义数据集​​

​​# 2、数据预处理​​

​​# 2.1、分离特征与标签​​

​​# 3、模型建立和训练​​

​​# 3.1、数据集切分# 3.2、模型训练​​

​​# 3.3、树模型可视化并保存图片​​

​​# 3.4、PDP可视化​​

​​# (1)、单特征PDP可视化​​

​​# (2)、双特征交互PDP可视化​​


相关文章
​​ML:机器学习可解释性之部分依赖图之每个特征如何影响您的预测?​​ML之PDP:基于FIFA 2018 Statistics(2018年俄罗斯世界杯足球赛)球队比赛之星分类预测数据集利用DT决策树&RF随机森林+PDP部分依赖图可视化实现模型可解释性之详细攻略
ML之PDP:基于FIFA 2018 Statistics(2018年俄罗斯世界杯足球赛)球队比赛之星分类预测数据集利用DT决策树&RF随机森林+PDP部分依赖图可视化实现模型可解释性之详细攻略实现

基于FIFA 2018 Statistics(2018年俄罗斯世界杯足球赛)球队比赛之星分类预测数据集利用DT决策树&RF随机森林+PDP部分依赖图可视化实现模型可解释性

# 1、定义数据集

数据集来源:​​Dataset:FIFA 2018 Statistics数据集(Predict FIFA 2018 Man of the Match预测2018年国际足联最佳球员)的简介、下载、使用方法之详细攻略_一个处女座的程序猿的博客

Date

Team

Opponent

Goal Scored

Ball Possession %

Attempts

On-Target

Off-Target

Blocked

Corners

Offsides

Free Kicks

Saves

Pass Accuracy %

Passes

Distance Covered (Kms)

Fouls Committed

Yellow Card

Yellow & Red

Red

Man of the Match

1st Goal

Round

PSO

Goals in PSO

Own goals

Own goal Time

14-06-2018

Russia

Saudi Arabia

5

40

13

7

3

3

6

3

11

0

78

306

118

22

0

0

0

Yes

12

Group Stage

No

0

14-06-2018

Saudi Arabia

Russia

0

60

6

0

3

3

2

1

25

2

86

511

105

10

0

0

0

No

Group Stage

No

0

15-06-2018

Egypt

Uruguay

0

43

8

3

3

2

0

1

7

3

78

395

112

12

2

0

0

No

Group Stage

No

0

15-06-2018

Uruguay

Egypt

1

57

14

4

6

4

5

1

13

3

86

589

111

6

0

0

0

Yes

89

Group Stage

No

0

15-06-2018

Morocco

Iran

0

64

13

3

6

4

5

0

14

2

86

433

101

22

1

0

0

No

Group Stage

No

0

1

90

# 2、数据预处理

# 2.1、分离特征与标签

df_X    Goal Scored  Ball Possession %  Attempts  ...  Yellow & Red  Red  Goals in PSO
0 5 40 13 ... 0 0 0
1 0 60 6 ... 0 0 0
2 0 43 8 ... 0 0 0
3 1 57 14 ... 0 0 0
4 0 64 13 ... 0 0 0

[5 rows x 18 columns]
df_y 0 True
1 False
2 False
3 True
4 False
Name: Man of the Match, dtype: bool

# 3、模型建立和训练

# 3.1、数据集切分
# 3.2、模型训练

# 3.3、树模型可视化并保存图片

# 将dot数据保存为图片

ML之PDP:基于FIFA 2018 Statistics(2018年俄罗斯世界杯足球赛)球队比赛之星分类预测数据集利用DT决策树&RF随机森林+PDP部分依赖图可视化实现模型可解释性之详细攻略

# 3.4、PDP可视化

# (1)、单特征PDP可视化

ML之PDP:基于FIFA 2018 Statistics(2018年俄罗斯世界杯足球赛)球队比赛之星分类预测数据集利用DT决策树&RF随机森林+PDP部分依赖图可视化实现模型可解释性之详细攻略

ML之PDP:基于FIFA 2018 Statistics(2018年俄罗斯世界杯足球赛)球队比赛之星分类预测数据集利用DT决策树&RF随机森林+PDP部分依赖图可视化实现模型可解释性之详细攻略

ML之PDP:基于FIFA 2018 Statistics(2018年俄罗斯世界杯足球赛)球队比赛之星分类预测数据集利用DT决策树&RF随机森林+PDP部分依赖图可视化实现模型可解释性之详细攻略

 

ML之PDP:基于FIFA 2018 Statistics(2018年俄罗斯世界杯足球赛)球队比赛之星分类预测数据集利用DT决策树&RF随机森林+PDP部分依赖图可视化实现模型可解释性之详细攻略

# (2)、双特征交互PDP可视化

ML之PDP:基于FIFA 2018 Statistics(2018年俄罗斯世界杯足球赛)球队比赛之星分类预测数据集利用DT决策树&RF随机森林+PDP部分依赖图可视化实现模型可解释性之详细攻略

ML之PDP:基于FIFA 2018 Statistics(2018年俄罗斯世界杯足球赛)球队比赛之星分类预测数据集利用DT决策树&RF随机森林+PDP部分依赖图可视化实现模型可解释性之详细攻略