背景: 刚入AI行业小白,搜了半天也没有找到wape指标解释,后来找到一篇英文解释,翻译过来跟大家分享一下
1.导言
在我们所处的时代,学习如何正确使用数据并充分利用数据非常重要。零售商很清楚这一点,因此会做出销售预测,以便提前做好计划。这可以帮助他们了解要订购的产品数量、库存量、库存量等,从而在保持客户供应的同时降低成本。
然而,我们怎么知道我们的预测足够好呢?我们如何衡量它的准确性?
在本教程中,我们将分析不同的方法。
2.问题
让我们想象一下,我们有一个小企业,在一个村庄里出售几加仑牛奶。我们想预测下周的销售量,从周一到周三。我们知道这个村子里的大多数人倾向于在星期一买很多牛奶,因此在星期二就不再买了,到星期三牛奶就用完了。考虑到之前的销售额,我们创建了一个简单的模型,并得出了此预测(此处与我们稍后获得的实际销售额进行了比较):
Monday | Tuesday | Wednesday | |
---|---|---|---|
Foreacast | 55 | 2 | 50 |
Actual sales | 50 | 1 | 50 |
现在,我们可以使用平均绝对误差公式计算预测得到的平均误差:
M A E = 1 n ∑ t = 1 n ∣ A t − F t ∣ MAE = \frac{1}{n}\sum_{t=1}^n \lvert A_t-F_t \rvert MAE=n1t=1∑n∣At−Ft∣
预测值为Ft,时间t的实际值为At。
这导致平均绝对误差为2。这不是很有用,因为它只是告诉我们预测错了2加仑牛奶。我们需要更好的销售信息。
3. MAPE
MAPE是衡量预测精度最常用的方法之一。它表示平均绝对百分比误差,并测量预测相对于实际值的百分比误差。由于它计算的是一段时间内或不同产品的平均误差,因此不会对它们进行区分。这意味着,它假设在哪一天或哪种产品之间没有更好的预测偏好。其计算如下:
M A P E = 1 n ∑ t = 1 n ∣ A t − F t A t ∣ MAPE = \frac{1}{n}\sum_{t=1}^n \lvert \frac{A_t-F_t}{A_t} \rvert MAPE=n1t=1∑n∣AtAt−Ft∣
在我们的预测结果中计算它:
Monday | Tuesday | Wednesday | Total | |
---|---|---|---|---|
Foreacast | 55 | 2 | 50 | |
Actual sales | 50 | 1 | 50 | |
MAPE | 10% | 100% | 0% | 36.7% |
4. WAPE
WAPE,也称为MAD/平均比率,表示加权平均百分比误差。它通过添加总销售额来加权误差:
W
A
P
E
=
∑
t
=
1
n
∣
A
t
−
F
t
∣
∑
t
=
1
n
∣
A
t
∣
WAPE = \frac{\sum_{t=1}^n \lvert A_t-F_t \rvert}{\sum_{t=1}^n \lvert A_t \rvert}
WAPE=∑t=1n∣At∣∑t=1n∣At−Ft∣
在我们的例子中:
Monday | Tuesday | Wednesday | Total | |
---|---|---|---|---|
Foreacast | 55 | 2 | 50 | |
Actual sales | 50 | 1 | 50 | |
WAPE | 10% | 100% | 0% | 5.9% |
现在我们可以看到错误是如何变得更有意义的,结果是5.9%。当销售总数可能较低或所分析的产品具有间歇性销售时,建议使用WAPE而不是MAPE。
5. WMAPE
如前所述,MAPE和WAPE均未考虑产品之间或时间上可能存在的优先级差异。在我们的示例中,假设我们发现周一是最重要的预测日。我们如何在预测误差中反映这一点?
当用例需要时,可以使用WMAPE。它表示加权平均绝对百分比误差,计算如下:
W M A P E = ∑ t = 1 n ( w t ∣ A t − F t ∣ ) ∑ t = 1 n ( w t ∣ A t ∣ ) WMAPE = \frac{\sum_{t=1}^n (w_t \lvert A_t-F_t \rvert)}{\sum_{t=1}^n (w_t \lvert A_t \rvert)} WMAPE=∑t=1n(wt∣At∣)∑t=1n(wt∣At−Ft∣)
这个公式允许我们对不同的因素赋予权重,从而赋予其重要性。
在我们的例子中,假设我们给星期一的重要性是80%,而其他日子的重要性是10%。这将导致:
Monday | Tuesday | Wednesday | Total | |
---|---|---|---|---|
Foreacast | 55 | 2 | 50 | 492 |
Actual sales | 50 | 1 | 50 | 451 |
Weight | 8 | 1 | 1 | 10 |
WAPE | 10% | 100% | 0% | 9.1% |
因此,考虑到周一的重要性,我们最终得出的WMAPE为9.1%。
6.结论
在这篇文章中,我们看到了三种不同的方法来衡量预测的准确性,以及如何应用它们。没有针对每个问题的完美度量,而是应该根据用例选择每个度量。
MAPE通常用于测量预测误差,但当销售额接近于零时,或在间歇销售中,它可能是欺骗。WAPE是一个衡量指标,通过将误差加权到总销售额中来抵消这一点。当用例需要在某些销售中设置优先级时,使用WMAPE。它对优先项目进行加权,从而使预测误差偏向优先项目。
所有这些指标都是对称的,这意味着它们不考虑预测是过度预测还是预测不足。这可能与某些问题有关(库存过多与库存不足并不相同),应予以考虑。
引用:
/cs/mape-vs-wape-vs-wmape