予測とは、過去と現在のデータに基づいて予測を行うプロセスです。これらの予測は、後に実際の結果と比較することができます。例えば、企業は翌年の収益を予測し、それを実際の結果と比較することで、差異分析を行うことができます。予測は類似していますが、より一般的な用語です。予測とは、時系列データ、横断的データ、または縦断的データを用いた特定の正式な統計手法を指す場合もあれば、より非公式な判断手法、あるいは予測とその精度の評価のプロセスを指す場合もあります。用法は応用分野によって異なります。例えば、水文学では、「予報」と「予測」という用語は、特定の将来の時点における値の推定値を指す場合がありますが、「予測」という用語は、長期間にわたる洪水の発生回数など、より一般的な推定値に使用されます。 [ 1 ]
リスクと不確実性は予測と予報の中心であり、一般的に予測に伴う不確実性の度合いを示すことが良い方法と考えられています。いずれにせよ、予測を可能な限り正確にするためには、データは最新でなければなりません。場合によっては、関心のある変数を予測するために使用されるデータ自体が予測されます。[ 2 ]予測は予算と混同しないでください。予算は、リソースの割り当てと管理に使用される、より具体的で、固定期間の財務計画です。一方、予測は将来の財務実績を見積もることで、変化する状況への柔軟性と適応性を考慮します。[ 3 ] どちらのツールも財務計画と意思決定に有用ですが、それぞれ異なる機能を果たします。
予測は、将来の状況を推定することが有用な幅広い分野に応用されています。分野によって、予測の精度は大きく異なります。予測対象に関連する要因が既知で十分に理解されており、利用可能なデータが豊富であれば、最終的な値は予測値に近づく可能性が高いです。そうでない場合、または実際の結果が予測によって影響を受ける場合、予測の信頼性は大幅に低下する可能性があります。[ 4 ]
気候変動とエネルギー価格の高騰により、建物へのEgain予測の適用が進んでいます。これは、建物の暖房に必要なエネルギーを削減し、温室効果ガスの排出量を削減することを目的としています。予測は、製造業や流通業の日常業務における 顧客需要計画に活用されています。
実際の株式リターンの予測の信憑性については、効率的市場仮説を根拠に議論が交わされていますが、経済の広範なトレンドの予測は一般的です。こうした分析は、非営利団体だけでなく、営利目的の民間機関によっても提供されています。
外国為替の動向予測は、通常、過去データと最新データ(チャートにまとめられる)とファンダメンタル分析の組み合わせによって行われます。チャート分析とファンダメンタル経済分析の本質的な違いは、チャーティストが市場の価格変動のみを研究するのに対し、ファンダメンタル分析は価格変動の背後にある理由を探ろうとすることです。[ 5 ]金融機関は、ファンダメンタル分析とチャーティストの研究者から提供された証拠を一つの報告書にまとめ、対象通貨に関する最終的な予測を提供します。[ 6 ]
予測は紛争状況の展開を予言するためにも使われてきた。[ 7 ]予測者は経験的結果を用いて特定の予測モデルの有効性を測定する研究を行っている。[ 8 ]しかし、研究によれば、紛争状況に精通した専門家の予測の精度と、それほど知識のない個人の予測の精度にはほとんど差がないことがわかっている。[ 9 ]同様に、一部の研究の専門家は、役割思考(他人の立場に立って彼らの決定を予測すること)は予測の精度には寄与しないと主張している。[ 10 ]
予測において、しばしば見落とされがちな重要な側面は、計画との関連性です。予測とは、将来がどのようになるかを予測することであり、計画とは、将来がどのようになるべきかを予測することです。[ 8 ]予測には唯一正しい方法というものはありません。予測方法の選択は、目的と状況(データなど)に基づいて行う必要があります。[ 11 ]予測方法を見つける良い方法は、選択ツリーを参照することです。選択ツリーの例は、こちらでご覧いただけます。[ 12 ]
予測はさまざまな状況で応用できます。
多くの場合、予測は将来の予測よりも多いか少ないかのいずれかになります。
フィリップ・E・テトロック著『スーパーフォーキャスティング:予測の芸術と科学』では、予測は意思決定能力を向上させる方法として論じられています。人はより正確に予測できるようになる、つまり10%の確率で10%の確率で起こるようになることができます。あるいは、より自信を持って予測できるようになる、つまり同じ結論により早く到達できるようになるのです。予測は、議論や意思決定の他の分野にも役立つ、応用可能なスキルであると主張する人もいます。
スポーツや政治への賭けも予測の一種です。賭けはアドバイスとして使われるのではなく、予想が当たったかどうかに基づいて報酬が支払われます。こうした賭け(予測)に基づいて意思決定が行われる場合もありますが、主な動機は一般的に金銭的なものです。
最後に、フタルキーとは、政府の行動の影響予測に基づいて行動を決定する政治形態です。フタルキーの最も強力な形態では、助言ではなく、最も予測される結果が最も良好な行動が自動的に実行されます。
予測改善プロジェクトは多くの分野で実施されており、国立ハリケーンセンターのハリケーン予測改善プロジェクト(HFIP)や米国エネルギー省が後援する風予測改善プロジェクトなどがその例である。[ 14 ]サプライチェーン管理に関しては、デュポンモデルを用いて予測精度の向上が売上高の増加、在庫、運営費、運転資本の削減につながることが示された。[ 15 ]食料品小売業界のサプライチェーン管理慣行を規制する英国の食料品コード裁定官は、規制の対象となるすべての小売業者が「予測慣行と販売促進活動の継続的な改善に努めている」と述べている。[ 16 ]
定性的な予測手法は主観的であり、消費者や専門家の意見や判断に基づいています。過去のデータが入手できない場合に適しています。通常、中期または長期の意思決定に適用されます。定性的な予測手法の例としては、情報に基づく意見と判断、デルファイ法、市場調査、歴史的ライフサイクルアナロジーなどが挙げられます。
定量的予測モデルは、過去のデータの関数として将来のデータを予測するために使用されます。過去の数値データが利用可能であり、データ内のいくつかのパターンが将来も継続すると想定するのが妥当な場合に使用するのが適切です。これらの方法は通常、短期または中期の意思決定に適用されます。定量的予測方法の例には、前期需要、単純および加重N期間移動平均、単純指数平滑法、ポアソン過程モデルに基づく予測[ 17 ]、乗法季節指数などがあります。以前の研究では、異なる方法によって予測精度のレベルが異なる可能性があることが示されています。たとえば、GMDHニューラルネットワークは、Single Exponential Smooth、Double Exponential Smooth、ARIMA、バックプロパゲーションニューラルネットワークなどの古典的な予測アルゴリズムよりも優れた予測性能を示すことがわかりました。[ 18 ]
このアプローチでは、すべての将来値の予測値は過去のデータの平均と等しくなります。このアプローチは、過去のデータが利用可能なあらゆる種類のデータに使用できます。時系列表記では、次のようになります。
過去のデータは どこにありますか。
ここでは時系列表記法を使用していますが、平均アプローチは横断データ(データセットに含まれていない観測されていない値を予測する場合)にも使用できます。その場合、観測されていない値の予測値は観測値の平均となります。
ナイーブ予測は最も費用対効果の高い予測モデルであり、より洗練されたモデルと比較するためのベンチマークを提供します。この予測手法は時系列データにのみ適しています。[ 19 ]ナイーブアプローチを使用すると、直近の観測値に等しい予測が生成されます。この手法は、信頼性と精度の高い予測が難しいパターンを持つことが多い経済・金融時系列に非常に有効です。[ 19 ]時系列に季節性があると考えられる場合、予測値が前シーズンの値に等しい季節ナイーブアプローチの方が適している可能性があります。時系列表記では、次のようになります。
ナイーブな手法のバリエーションとして、予測値が時間の経過とともに増加または減少することを許容する方法があります。この場合、時間経過に伴う変化量(ドリフトと呼ばれる)は、過去のデータに見られる平均的な変化とみなされます。したがって、時間経過に伴う予測値は次のように表されます 。
これは、最初の観測値と最後の観測値の間に線を引いて、それを将来に外挿することと同じです。
季節ナイーブ法は、各予測値を同じ季節の直近の観測値と等しく設定することで季節性を考慮します。例えば、4月以降のすべての月の予測値は、4月の前回の観測値と等しくなります。時間予測は[ 19 ]です。
ここで、 は季節期間(たとえば、年間季節性を持つ月次データの場合、)、は の整数部分です。
季節ナイーブ法は、季節性が非常に高いデータに特に役立ちます。
決定論的アプローチとは、確率変数が含まれず、予測が選択された関数とパラメータに依存する場合である。[ 20 ] [ 21 ]例えば、関数
短期的な行動 と中長期的な傾向は
パラメータがいくつかあります。
このアプローチは、一見確率的な活動のバーストと、それらがより静かな期間によって中断される様子をシミュレートするために提案された。強い決定論的要素の存在がノイズによって隠されているという仮定に基づいている。この決定論的アプローチは、根底にある力学系の構造を明らかにできるという点で注目に値し、これを利用して力学系を望ましい状態へと導くことができる。[ 20 ]
時系列分析法は、過去の需要履歴が将来の需要の優れた指標であるという仮定に基づいて、過去のデータを将来の予測の基礎として用います。
いくつかの予測手法は、予測対象となる変数に影響を与える可能性のある根本的な要因を特定しようとします。例えば、気候パターンに関する情報を含めることで、傘の売上を予測するモデルの能力が向上する可能性があります。予測モデルは、多くの場合、季節的な変動を考慮します。気候に加えて、休日や習慣によっても、このような変動が生じる可能性があります。例えば、大学フットボールのアパレルの売上は、フットボールシーズン中の方がオフシーズンよりも高くなると予測されるかもしれません。[ 22 ]
因果予測に用いられるいくつかの非公式な手法は、数学的アルゴリズムの出力のみに頼るのではなく、予測者の判断に頼ります。一部の予測では、変数間の過去の関係が考慮されています。例えば、ある変数が長期間にわたって別の変数とほぼ線形関係にある場合、必ずしもその関係の理由を理解していなくても、そのような関係を将来に外挿することが適切である場合があります。
因果的方法には次のものがあります:
定量予測モデルは、サンプル内またはサンプル外の平均二乗誤差を比較することで互いに評価されることが多いが、一部の研究者はこれを推奨していない。[ 24 ]予測手法によって精度のレベルは異なる。例えば、ある状況では、GMDHは従来のARIMAよりも高い予測精度を示すことがわかった。[ 25 ]
判断的予測手法は、直感的な判断、意見、そして主観的な確率推定を組み込んだものです。判断的予測は、過去のデータが不足している場合や、全く新しい特殊な市場状況において用いられます。[ 26 ]
判断方法には次のものがあります。
これらは今日では、大まかにラベル付けされた専門プログラムによって行われることが多い。
系列の3点と「モーメント」または「インデックス」を用いて作成できます。このタイプの外挿は、既知の系列データベース(OEIS)の大部分において100%の予測精度を有します。[ 27 ]
予測誤差(残差とも呼ばれる)は、対応する期間の実際の値と予測値の差です。
ここで、E は期間 t における予測誤差、Y は期間 t における実際の値、F は期間 t の予測です。
優れた予測手法は、相関のない残差を生成します。残差値間に相関がある場合、残差には予測計算に用いるべき情報が残っています。これは、既知の過去の残差の関数として残差の期待値を計算し、この期待値がゼロからどれだけ離れているかに応じて予測を調整することで実現できます。
優れた予測手法では、平均はゼロになります。残差の平均がゼロでない場合、予測には偏りがあり、調整前の残差の平均に等しい加法定数を用いて予測手法を調整することで、予測精度を向上させることができます。
集計誤差の測定:
予測誤差 E はデータと同じスケールであるため、これらの精度の尺度はスケールに依存し、異なるスケールの系列間の比較には使用できません。
平均二乗誤差(MSE) または平均二乗予測誤差(MSPE):
二乗平均平方根誤差(RMSE):
誤差の平均(E):
これらはスケールに依存しないため、異なるデータセット間の予測パフォーマンスを比較する際によく使用されます。ただし、Yがゼロに近いか等しい場合、非常に大きくなるか定義されないという欠点があります。
平均絶対パーセント誤差(MAPE):
平均絶対パーセンテージ偏差(MAPD):
Hyndman と Koehler (2006) は、パーセンテージ誤差の代替としてスケール誤差の使用を提案しました。
平均絶対スケール誤差(MASE):
ここで、 mは季節期間、または非季節の場合は1
予測スキル(SS):
ビジネス予測者や実務家は、異なる用語を使用する場合があります。彼らはPMADをMAPEと呼びますが、実際には数量加重MAPEとして計算します。詳細については、「需要予測精度の計算」をご覧ください。
特定のデータ セットに対するさまざまな予測方法の精度を比較する場合、集計エラーの測定値が相互に比較され、エラーが最も低い方法が優先されます。
予測の質を評価する際に、モデルが過去のデータにどれだけ適合しているかを見るだけでは不十分です。予測の精度は、モデルの適合時に使用しなかった新しいデータに対して、モデルがどれだけ優れたパフォーマンスを発揮するかを考慮することによってのみ判断できます。モデルを選択する際には、上記の例のように、利用可能なデータの一部を適合に使用し、残りのデータをモデルのテストに使用するのが一般的です。[ 28 ]
クロス検証は、テスト セットのトレーニングのより洗練されたバージョンです。
横断的データの場合、クロス検証の 1 つのアプローチは次のように機能します。
これにより、各ステップで1つの観測のみが省略されるため、利用可能なデータが効率的に使用されます。
時系列データの場合、トレーニングセットにはテストセットより前の観測値のみを含めることができます。したがって、将来の観測値は予測の構築に使用できません。信頼性の高い予測を生成するためにk個の観測値が必要であると仮定すると、プロセスは次のように機能します。
この手順は、予測の基準となる「原点」(k+i -1)が時間的に前進するため、「ローリング予測原点」と呼ばれることもあります。 [ 28 ]さらに、2ステップ先、または一般的にはpステップ先の予測は、まずトレーニングセットの直後の値を予測し、次にこの値とトレーニングセットの値を使用して2期間先を予測する、などによって計算できます。
参照
季節性とは、データが毎年繰り返される規則的かつ予測可能な変化を経験する時系列の特性です。時系列において1年間にわたって繰り返される予測可能な変化やパターンは、季節性があると言えます。食料品店[ 29 ]や検死官事務所[ 30 ]など、多くの状況において、需要が曜日によって異なることはよく見られます。このような状況では、予測手順では「季節」の季節指数(7つの季節、各日1つ)を計算します。これは、その季節の平均需要(その季節のみに対応する履歴データを用いて移動平均法または指数平滑法で計算されます)と全季節の平均需要の比率です。指数が1より大きい場合、需要は平均よりも高いことを示し、指数が1より小さい場合、需要は平均よりも低いことを示します。
データの周期的な行動は、通常少なくとも 2 年の間隔でデータに定期的な変動があり、現在のサイクルの長さを事前に予測できない場合に発生します。周期的な行動を季節的な行動と混同しないでください。季節的な変動は毎年一貫したパターンに従うため、周期は常にわかっています。たとえば、クリスマス期間中は、クリスマスの買い物客に備えて店舗の在庫が増加する傾向があります。周期的な行動の一例として、特定の自然生態系の個体数は、自然の食物源が減少するにつれて個体数が減少するときに周期的な行動を示します。個体数が少なくなると、食物源が回復し、個体数が再び増加し始めます。周期的なデータは固定期間ではないため、通常の季節調整を使用して説明することはできません。
限界は、それを超えると予測方法が確実に予測できない障壁となります。確実に予測できない事象や値は数多くあります。サイコロを振る、宝くじの結果といった事象はランダムな事象であり、データに有意な関係がないため予測できません。株式市場や外国為替市場のように、予測対象につながる要因がわかっていない、または十分に理解されていない場合、予測は不正確または間違っていることがよくあります。これは、これらの市場に影響を与えるすべての要因に関するデータが十分でないため予測が信頼できるものではなく、さらにこれらの市場の予測結果が市場関係者の行動を変え、予測の精度がさらに低下するからです。[ 4 ]
「自己破壊的な予測」という概念は、一部の予測が社会行動に影響を与えることで自らを弱めてしまう可能性があることに関係している。[ 31 ]これは、「予測者は予測しようとしている社会的な文脈の一部であり、その過程でその文脈に影響を与える可能性がある」ためである。[ 31 ]例えば、既存の傾向に基づいて人口の大部分がHIVに感染するという予測は、より多くの人々が危険な行動を避けるようになり、その結果HIV感染率が低下し、予測が無効になる可能性がある(公表されていなければ、その予測は正しかったかもしれない)。あるいは、サイバーセキュリティが大きな問題になるという予測は、組織がより多くのセキュリティ対策を実施することになり、その結果、問題が限定的になる可能性がある。
エドワード・ローレンツが1963年に提唱したように、2週間以上の長期天気予報では、流体力学方程式のカオス的性質のために、大気の状態を明確に予測することは不可能である。数値モデルでは、気温や風速などの初期入力における極めて小さな誤差が5日ごとに倍増する。[ 32 ]
予算は特定の期間の財務目標を設定する一方、予測は期待される成果を継続的に把握することで、企業が柔軟性を維持し、変化に適応するのに役立ちます。