文件名称:MLB-Project
文件大小:1011KB
文件格式:ZIP
更新时间:2024-04-10 01:08:41
JupyterNotebook
美国职业棒球大联盟 与大多数体育比赛一样,为了赢得棒球比赛,获胜球队必须比对垒球队得分更高。该项目侧重于美国职业棒球大联盟的得分方面。 通过10倍交叉验证比较两个线性回归模型,尽管简单的线性回归似乎更准确,但是这两个模型之间的差异似乎很小。 产生这种结果的可能原因之一是,这两个预测因子(OPS与TB + OBP)在棒球中的测量结果相似。对于那些不熟悉这项运动的人,我将简要解释这三个数据在健身中的作用。 首先,结核病衡量的是通过点击获得的碱基总数。它为单个分配1总碱基,向双分配2总碱基,向三重分配3总碱基,向本垒打分配4总碱基。因此,一支球队的结核病数据显示,整个赛季中,该团队获得了多少单打以及超垒打(双打+三连冠+本垒打)。 其次,OBP(基准百分比)测量击球手到达底脚的频率(例如,OBP为0.400表示此击球手在10个板中出现四次到达底脚)。它包括“命中”(单曲+额外的基础命中),“按球
【文件预览】:
MLB-Project-main
----images()
--------Histogram.png(73KB)
--------Yearly Changes.png(12KB)
--------Scatter Plots.png(170KB)
--------KDE Plot.png(69KB)
--------Filtered Correlation Matrix.png(41KB)
--------Q-Q Plots.png(89KB)
--------Correlation Matrix.png(23KB)
----data()
--------batting_2017.csv(6KB)
--------batting_2016.csv(6KB)
--------batting_2013.csv(6KB)
--------batting_2014.csv(6KB)
--------batting_2011.csv(6KB)
--------batting_2018.csv(6KB)
--------batting_2010.csv(6KB)
--------batting_2015.csv(6KB)
--------batting_2019.csv(6KB)
--------batting_2012.csv(6KB)
----code.ipynb(715KB)
----README.md(3KB)