対称平均絶対パーセント誤差

対称平均絶対パーセンテージ誤差SMAPEまたはsMAPE)は、パーセンテージ(または相対)誤差に基づく精度指標です。通常、以下のように定義されます。

スマップ2nt1n|FtAt||At|+|Ft|{\displaystyle {\text{SMAPE}}={\frac {2}{n}}\sum _{t=1}^{n}{\frac {\left|F_{t}-A_{t}\right|}{|A_{t}|+|F_{t}|}}}

ここで、 は実際の値、は予測値です。の場合、項は未定義()となり、通常は合計において無視されることに注意してください。 At{\displaystyle A_{t}}Ft{\displaystyle F_{t}}AtFt0{\displaystyle A_{t}=F_{t}=0}t{\displaystyle t}0/0{\displaystyle 0/0}

この式を言葉で説明すると、A tF t絶対差を、実際の値A tと予測値F tの絶対値の合計の半分で割ります。この計算値は、各フィッティング点tについて合計され、フィッティング点の数 nで再び割ります。

歴史

同様の式への最も古い言及はArmstrong (1985, p. 348) のようです。そこでは「調整MAPE」と呼ばれ、分母に絶対値を入れずに定義されています。後にFlores (1986) によって議論、修正、再提案されました

アームストロングのオリジナルの定義は次のとおりです。

スマップ1nt1n|FtAt|At+Ft/2{\displaystyle {\text{SMAPE}}={\frac {1}{n}}\sum _{t=1}^{n}{\frac {\left|F_{t}-A_{t}\right|}{(A_{t}+F_{t})/2}}}

問題は、 の場合に負の値になる可能性があることです。そのため、現在受け入れられているSMAPEのバージョンでは、分母に絶対値があることを前提としています。 At+Ft<0{\displaystyle A_{t}+F_{t}

考察

MAPEとの比較

SMAPEの考え方は、平均絶対百分率誤差MAPE )のように絶対的な方法ではなく、相対的な方法で予測の超過と不足を扱うというものです。例えば、上記の式をいくつかの実際の値 と予測値に適用すると、次のようになりますA{\displaystyle A}F{\displaystyle F}

A{\displaystyle A}F{\displaystyle F}メープスメープ
10011010%9.52%
1009010%10.53%

MAPEでは10%の過大評価と過小評価は同等とみなされているのに対し、SMAPEでは過小評価の方が過大評価よりもわずかに「悪い」とみなされていることがわかります

これをより大きな予測誤差に拡張すると、次のようになります。

A{\displaystyle A}F{\displaystyle F}メープスメープ
100200100%66.67%
1005050%66.67%

ここで、 SMAPEでは2倍の過大評価と半分の過小評価は同等に扱われますが、MAPEでは過大評価は過小評価よりも「2倍悪い」とみなされます

さらに極端な例を挙げると、

A{\displaystyle A}F{\displaystyle F}メープスメープ
1001,000900%163.63%
1001090%163.63%

ここで、MAPEは上限が定められておらず、過大評価に対しては非常に大きなペナルティを課すことができるものの、極端な過小評価に対しては同様のペナルティを課すことができないことが明らかになります。一方、SMAPEは0%から200%の間で上限が定められており、より大きな過大評価と過小評価に対してより「対称的」な方法でペナルティを課します。

したがって、MAPEとSMAPEのどちらを選択するかは、問題の内容と、相対的な指標がより適切かどうかによって完全に決まります。予測誤差が を超える場合、相対的な指標がより適切である可能性があります。一方、誤差が小さい場合は、その単純さと解釈の容易さから、MAPEが選択されることが多いです。 10%{\displaystyle \gg 10\%}

代替バージョン

「パーセンテージ誤差」として、0%から100%の間のSMAPE値は解釈しやすいと考えられており、実際には代替の式が使用されることがあります

スマップ1nt1n|FtAt||At|+|Ft|{\displaystyle {\text{SMAPE}}={\frac {1}{n}}\sum _{t=1}^{n}{\frac {|F_{t}-A_{t}|}{|A_{t}|+|F_{t}|}}}

SMAPEには3つ目のバージョンもあり、これは項目レベルで正と負の誤差を生成することで、データのバイアス方向を測定できます。さらに、外れ値やバイアスの影響に対する保護も強化されています。式は以下のとおりです。

スマップt1n|FtAt|t1nAt+Ft{\displaystyle {\text{SMAPE}}={\frac {\sum _{t=1}^{n}\left|F_{t}-A_{t}\right|}{\sum _{t=1}^{n}(A_{t}+F_{t})}}}

代替案

データが厳密に正である場合、精度比の対数に基づいて相対精度の代替指標を得ることができます:log( Ft /At )この指標は統計的に分析しやすく、対称性と偏りのない特性を備えています。予測モデルの構築に使用する場合、結果として得られる予測値は幾何平均に対応します(Tofallis, 2015)。

参照

参考文献