我知道,MAPE和WMAPE作为预测误差的指标,它们有一定的益处。 但是,什么是差距? 有人说:
For MAPE:
"Combinations with very small or zero volumes can cause large skew in results"
And for WMAPE:
"Combinations with large weights can skew the results in their favor"
我不明白,任何人都可以解释为两个指标的弱点两种说法? 谢谢。
为MAPE,平均绝对误差百分比[1],假设我们表示具有一个实际值,并且其中P预测值。 您在时间1有一系列数据的直通n,则
MAPE = 100/n * ( Sum of |(A(t) - P(t))/A(t)| ), for t in 1..n
where A(t) is the actual value at time t, P(t) is the predicted value at time t.
由于A(t)为分母,只要你有一个非常小或接近零A(T),该部门是像一个由零,这会在绝对百分比误差非常大的变化划分。 这样大的变化的组合导致的结果大的倾斜是肯定的。
对于WMAPE,加权平均绝对误差百分比,
Sum of |(A(t) - P(t))/A(t)| * W(t)
WMPAE = -------------------------------------, for t in 1..n
Sum of W(t)
where W(t) is the weight you associate with the prediction at time t.
由于这是一个加权衡量,它并没有同样的问题MAPE,例如,过度倾斜由于非常小或为零卷。
然而,权重因子将表明我们希望将每个预测[2]的主观重要性。
例如,考虑到发布日期,我们可以这样一种方式,权重越高分配权重,我们将在近期数据更高的重要性。 在这种情况下,我们可以观察到,即使在MAE是在合理的阈值时,系统的性能分析这种特殊的功能时,可能是不够的。
这是一个有利于更近的数据如何歪斜的结果。
[1] http://en.wikipedia.org/wiki/Mean_absolute_percentage_error
[2] http://ir.ii.uam.es/rue2012/papers/rue2012-cleger-tamayo.pdf
也有另一种错误的度量:
WAPE = 100/n * Sum(|(A(t) - P(t)|)/sum(A(t)), for t in 1..n
where A(t) is the actual value at time t, P(t) is the predicted value at time t.
它不是大的失真敏感。