平均絶対パーセント誤差 (MAPE )は、 平均絶対パーセント偏差 (MAPD )とも呼ばれ、統計学 における予測手法の予測精度を表す指標です。通常、精度は次の式で定義される比率で表されます。
マップ = 100 1 n ∑ t = 1 n | あ t − F t あ t | {\displaystyle {\mbox{MAPE}}=100{\frac {1}{n}}\sum _{t=1}^{n}\left|{\frac {A_{t}-F_{t}}{A_{t}}}\right|} ここで、A t は実際の値、F t は予測値です。これらの差を実際の値A t で割ります。この比率の絶対値は、予測される時点ごとに合計され、適合点の数 n で割ります。MAPEは予測において非常に慎重に使用する必要があります。実際の値(目標ラベル)が小さいと、MAPEスコアが大幅に高くなる可能性があるためです。可能な限り、MAPEの代わりにwMAPEを使用してください(以下のセクションを参照)。
回帰問題におけるMAPE 平均絶対パーセンテージ誤差は、相対誤差の観点から非常に直感的に解釈できるため、 回帰問題 やモデル評価の損失関数としてよく使用されます。
意味 データが、、 、および のn 個のiidコピーを持つランダムなペアによって完全に記述される標準的な回帰設定を考えてみましょう。回帰モデルは、から まで測定可能な関数 gで、 Y に近い、ペアに適したモデルを見つけることを目的とします。 Z = ( X 、 はい ) {\displaystyle Z=(X,Y)} R d × R {\displaystyle \mathbb {R} ^{d}\times \mathbb {R} } ( X 1 、 はい 1 ) 、 。 。 。 、 ( X n 、 はい n ) {\displaystyle (X_{1},Y_{1}),...,(X_{n},Y_{n})} ( X 、 はい ) {\displaystyle (X,Y)} R d {\displaystyle \mathbb {R} ^{d}} R {\displaystyle \mathbb {R} } グラム ( X ) {\displaystyle g(X)}
古典的な回帰分析では、 Y への近さはL 2 リスク(平均二乗誤差 (MSE)とも呼ばれる)によって測定されます。MAPE回帰[ 1 ] では、 Y への近さはMAPEによって測定され、MAPE回帰の目的は以下の式を満たす モデルを見つけることです。グラム ( X ) {\displaystyle g(X)} グラム ( X ) {\displaystyle g(X)} グラム マップ {\displaystyle g_{\text{MAPE}}}
グラム M あ P E ( × ) = 引数 分 グラム ∈ G E [ | グラム ( X ) − はい はい | | X = × ] {\displaystyle g_{\mathrm {MAPE} }(x)=\arg \min _{g\in {\mathcal {G}}}\mathbb {E} {\Biggl [}\left|{\frac {g(X)-Y}{Y}}\right||X=x{\Biggr ]}}
ここで、考慮されるモデルのクラス(例:線形モデル)です。 G {\displaystyle {\mathcal {G}}}
実際には
実際には経験的リスク最小化 戦略によって推定することができ、 グラム マップ ( × ) {\displaystyle g_{\text{MAPE}}(x)}
グラム ^ マップ ( × ) = 引数 分 グラム ∈ G ∑ 私 = 1 n | グラム ( X 私 ) − はい 私 はい 私 | {\displaystyle {\widehat {g}}_{\text{MAPE}}(x)=\arg \min _{g\in {\mathcal {G}}}\sum _{i=1}^{n}\left|{\frac {g(X_{i})-Y_{i}}{Y_{i}}}\right|}
実用的な観点から見ると、回帰モデルの品質関数としてMAPEを用いることは、重み付き平均絶対誤差(MAE)回帰 (分位点回帰 とも呼ばれる)を行うことと同等である。この性質は自明である。
グラム ^ マップ ( × ) = 引数 分 グラム ∈ G ∑ 私 = 1 n ω ( はい 私 ) | グラム ( X 私 ) − はい 私 | と ω ( はい 私 ) = | 1 はい 私 | {\displaystyle {\widehat {g}}_{\text{MAPE}}(x)=\arg \min _{g\in {\mathcal {G}}}\sum _{i=1}^{n}\omega (Y_{i})\left|g(X_{i})-Y_{i}\right|{\mbox{ with }}\omega (Y_{i})=\left|{\frac {1}{Y_{i}}}\right|}
その結果、MAPE の使用は実際には非常に簡単であり、たとえば重み付けを許可する分位回帰用の既存のライブラリを使用できます。
一貫性 MAPEを回帰分析の損失関数として使用することは、最適モデルの存在と経験的リスク最小化の一貫性 が証明できるため、実用的な観点からも理論的観点からも実現可能である。 [ 1 ]
WMAPE WMAPE (wMAPE と表記されることもある)は、加重平均絶対パーセント誤差(weighted mean absolute percent error)の略である。[ 2 ] これは、回帰モデルや予測モデルの性能を評価するために使用される指標である。これはMAPEの派生であり、平均絶対パーセント誤差を加重算術平均として扱う。最も一般的なのは、絶対パーセント誤差を実績値で加重する(例えば、売上予測の場合、誤差は売上量で加重する)。[ 3 ] これにより、「無限誤差」の問題が実質的に克服される。[ 4 ] その式は以下の通りである。[ 4 ] wMAPE = ∑ 私 = 1 n ( わ 私 ⋅ | あ 私 − F 私 | | あ 私 | ) ∑ 私 = 1 n わ 私 = ∑ 私 = 1 n ( | あ 私 | ⋅ | あ 私 − F 私 | | あ 私 | ) ∑ 私 = 1 n | あ 私 | {\displaystyle {\mbox{wMAPE}}={\frac {\displaystyle \sum _{i=1}^{n}\left(w_{i}\cdot {\tfrac {\left|A_{i}-F_{i}\right|}{|A_{i}|}}\right)}{\displaystyle \sum _{i=1}^{n}w_{i}}}={\frac {\displaystyle \sum _{i=1}^{n}\left(|A_{i}|\cdot {\tfrac {\left|A_{i}-F_{i}\right|}{|A_{i}|}}\right)}{\displaystyle \sum _{i=1}^{n}\left|A_{i}\right|}}}
は重み、は実際のデータのベクトル、は予測値です。しかし、これは実際にははるかに単純な式に簡略化されます。 わ 私 {\displaystyle w_{i}} あ {\displaystyle A} F {\displaystyle F} wMAPE = ∑ 私 = 1 n | あ 私 − F 私 | ∑ 私 = 1 n | あ 私 | {\displaystyle {\mbox{wMAPE}}={\frac {\displaystyle \sum _{i=1}^{n}\left|A_{i}-F_{i}\right|}{\displaystyle \sum _{i=1}^{n}\left|A_{i}\right|}}}
紛らわしいことに、wMAPEについて言及する際に、上記のwMAPE式の分子と分母に別のカスタム重み付けを加えた別のモデルを指している場合があります。これは、二重重み付けMAPE(wwMAPE)と呼ぶ方が正確かもしれません。その式は次のとおりです。 わ 私 {\displaystyle w_{i}} wwwMAPE = ∑ 私 = 1 n わ 私 | あ 私 − F 私 | ∑ 私 = 1 n わ 私 | あ 私 | {\displaystyle {\mbox{wwMAPE}}={\frac {\displaystyle \sum _{i=1}^{n}w_{i}\left|A_{i}-F_{i}\right|}{\displaystyle \sum _{i=1}^{n}w_{i}\left|A_{i}\right|}}}
問題 MAPEの概念は非常に単純で説得力があるように聞こえるが、実際の適用においては大きな欠点があり[ 5 ] 、MAPEの欠点や誤解を招く結果に関する研究も数多くある[ 6 ] [ 7 ] 。
ゼロまたはゼロに近い値がある場合(需要データなどで時々発生します)は、ゼロ除算またはMAPEの値が無限大に近づくため、使用できません。[ 8 ] 予測が低すぎる場合、パーセンテージ誤差は 100% を超えることはできませんが、予測が高すぎる場合、パーセンテージ誤差に上限はありません。 MAPEは、正の誤差よりも負の誤差に重いペナルティを課します。 [ 9 ] 結果として、MAPEを予測手法の精度比較に使用した場合、予測値が低すぎる手法が体系的に選択されるというバイアスが生じます。このあまり知られていないが深刻な問題は、精度比(予測値と実際の値の比)の対数に基づく精度指標を使用することで克服できます。この指標は次のように表されます。このアプローチは優れた統計特性をもたらし、幾何平均で解釈できる予測値にもつながります。[ 5 ] あ t < F t {\displaystyle A_{t} ログ ( 予測された 実際の ) {\textstyle \log \left({\frac {\text{予測値}}{\text{実際値}}}\right)} MAPEは中央値で最適化されると考える人が多いですが、例えば対数正規分布の中央値は ですが、MAPEは で最適化されます。e μ {\displaystyle e^{\mu}} e μ − σ 2 {\displaystyle e^{\mu -\sigma ^{2}}} MAPE に関するこれらの問題を克服するために、文献では他の対策も提案されています。
参照
外部リンク
参考文献 ^ a b de Myttenaere, B Golden, B Le Grand, F Rossi (2015). 「回帰モデルの平均絶対パーセンテージ誤差」Neurocomputing 2016 arXiv : 1605.02541 ^ 「予測精度の理解:MAPE、WAPE、WMAPE」 。 ^ 「WMAPE: 加重平均絶対パーセント誤差」 。 ^ a b 「統計予測誤差」 。 ^ a b Tofallis (2015). 「モデル選択とモデル推定のための相対予測精度のより良い尺度」, Journal of the Operational Research Society , 66(8):1352-1362.アーカイブプレプリント ^ Hyndman, Rob J., Anne B. Koehler (2006). 「予測精度の尺度に関する新たな考察」 International Journal of Forecasting , 22(4):679-688 doi:10.1016/j.ijforecast.2006.03.001 . ^ a b Kim, Sungil and Heeyoung Kim (2016). 「断続的な需要予測における絶対パーセンテージ誤差の新しい指標」International Journal of Forecasting , 32(3):669-679 doi:10.1016/j.ijforecast.2015.12.003 . ^ キム・スンギル、キム・ヒヨン(2016年7月1日) 「断続的な需要予測における絶対パーセンテージ誤差の新しい指標」 国際 予測ジャーナル 32 ( 3 ): 669-679。doi : 10.1016/ j.ijforecast.2015.12.003 。 ^ マクリダキス、スパイロス(1993)「精度測定:理論的および実践的懸念事項」国際予測ジャーナル 、9(4):527-529 doi:10.1016/0169-2070(93)90079-3