極値理論

極値理論は、1755年のリスボン地震のような極端で稀な事象のリスクをモデル化するために使用されます

極値理論または極値分析( EVA ) は、統計分布における極値の研究です。

EVAは、構造工学金融保険数理学経済学地球科学、交通予測、地質工学など、多くの分野で広く利用されています。例えば、EVAは水文学の分野で、 100年に一度の洪水のような異常に大規模な洪水の発生確率を推定するために使用されることがあります。同様に、防波堤の設計においては、沿岸技術者は50年に一度の波を推定し、それに応じて構造物を設計しようとします。

データ分析

実用的な極値解析には、主に2つのアプローチがあります。

最初の方法は、予備的なステップとしてブロックの最大値(最小値)系列を導出することに依存しています。多くの場合、年間の最大値(最小値)を抽出して年間最大値系列(AMS) を生成するのが慣例であり便利です

2つ目の方法は、連続記録から、値が特定の閾値を超えた(または特定の閾値を下回った)期間のピーク値を抽出するというものです。この方法は一般に、ピーク閾値超過法(POT法)と呼ばれます。[ 1 ]

AMSデータの場合、解析は部分的にフィッシャー・ティペット・グネデンコ定理の結果に依存し、一般化極値分布がフィッティングに選択される。[ 2 ] [ 3 ]しかし、実際には、より広範囲の分布から選択するために様々な手順が適用される。ここでの定理は、同じ分布からの非常に大規模な独立確率変数の集合の最小値または最大値の極限分布に関係する。1年間の関連するランダムイベントの数がかなり限られていることを考えると、観測されたAMSデータの解析で一般化極値分布(GEVD)以外の分布が選択されることが多いのは驚くべきことではない。[ 4 ]

POT データの場合、分析には 2 つの分布を当てはめる必要があります。1 つは対象期間内のイベント数用、もう 1 つは超過のサイズ用です。

前者については、ポアソン分布を仮定し、超過分については一般化パレート分布を用いるのが一般的である。裾の当てはめは、ピカンズ・バルケマ・ド・ハーンの定理に基づいて行うことができる。[ 5 ] [ 6 ]

Novak(2011)は、「POT法」という用語を閾値が非ランダムな場合のみに使用し、ランダムな閾値の超過を扱う場合と区別しています。[ 7 ]

応用

極値理論の応用には、以下の確率分布の予測が含まれます

歴史

極値理論の分野は、L・ティペット(1902-1985)によって開拓された。ティペットは英国綿工業研究協会に勤務し、綿糸をより強くする研究を行った。研究を進める中で、彼は糸の強度はその最も弱い繊維の強度によって決まることを認識した。RAフィッシャーの協力を得て、ティペットは独立変数を仮定して極値の分布を記述する3つの漸近極限を得た。EJガンベル(1958)[ 28 ]はこの理論を体系化した。これらの結果は、変数間にわずかな相関関係があるように拡張できるが、古典理論は分散のオーダーの強い相関関係には拡張できない。特に興味深い普遍性クラスの1つは、相関が距離とともに対数的に減少する 対数相関フィールドである。

一変量理論

単一変数の極値に関する理論は、フィッシャー・ティペット・グネデンコ定理とも呼ばれる極値定理によって支配されており、これは特定の統計変数に対して、 極値の3つの可能な分布のどれが当てはまるかを記述しますバツ{\displaystyle X}

多変数理論

多変数における極値理論は、対処しなければならない追加の問題をもたらします。生じる問題の1つは、何が極端事象を構成するかを特定しなければならないことです。[ 29 ] これは単変数の場合は簡単ですが、多変数の場合は明確な方法がありません。根本的な問題は、実数値の集合を順序付けることは可能であっても、ベクトルの集合を順序付ける自然な方法がないことです

例えば、一変量の場合、観測値の集合が与えられれば、その最大値(または最小値)を取るだけで最も極端な事象を簡単に見つけることができます。しかし、二変量の場合、観測値の集合が与えられても、最も極端な事象をどのように見つけるかはすぐには分かりません。ある特定の時点の値と、それより後の時点の値を測定したとします。これらの事象のうち、どちらがより極端であると考えられますか?この問いに対する普遍的な答えはありません。  バツi {\displaystyle \x_{i}\} バツiyi {\displaystyle \(x_{i},y_{i})\} 34 {\displaystyle \(3,4)\} 52 {\displaystyle \ (5,2)\ }

多変量の場合のもう一つの問題は、限界モデルが単変量の場合ほど完全に規定されていないことである。単変量の場合、モデル(GEV分布)には理論では予測できない3つのパラメータが含まれており、分布をデータに当てはめることによって値を得る必要がある。多変量の場合、モデルには未知のパラメータだけでなく、理論では正確な形が規定されていない関数も含まれる。しかし、この関数は特定の制約に従わなければならない。[ 30 ] [ 31 ] このような制約に従う推定量を考案するのは簡単ではないが、最近ではいくつか構築されている。[ 32 ] [ 33 ] [ 34 ]

応用例として、二変量極値理論は海洋研究に応用されている。[ 29 ] [ 35 ]

非定常極値

非定常時系列の統計モデリングは1990年代に開発されました。[ 36 ]非定常多変量極値のための手法は最近導入されました。[ 37 ] 後者は、極値間の依存関係が時間の経過や別の共変量に対してどのように変化するかを追跡するために使用できます。[ 38 ] [ 39 ] [ 40 ]

参照

参考文献

  1. ^ Leadbetter, MR (1991). 「『閾値を超えるピーク』モデリングの基礎について」. Statistics and Probability Letters . 12 (4): 357–362 . doi : 10.1016/0167-7152(91) 90107-3
  2. ^フィッシャー&ティペット(1928)
  3. ^グネデンコ(1943)
  4. ^エンブレヒト、クルッペルベルク、ミコシュ (1997)
  5. ^ピカンズ(1975)
  6. ^バルケマ&デ・ハーン(1974)
  7. ^ノヴァク(2011)
  8. ^ティペット、レポア、コーエン(2016)
  9. ^ Batt, Ryan D.; Carpenter, Stephen R.; Ives, Anthony R. (2017年3月). 「湖沼生態系における極端現象の時系列」 . Limnology and Oceanography Letters . 2 (3): 63. Bibcode : 2017LimOL...2...63B . doi : 10.1002/lol2.10037 .
  10. ^アルバラード、サンドバーグ、ピックフォード(1998)、68ページ
  11. ^マコネン (2008)
  12. ^ Einmahl, JHJ; Smeets, SGWR (2009).極値理論による究極の100m世界記録(PDF) (レポート). CentER Discussion Paper. Vol. 57. ティルブルフ大学.オリジナル(PDF)から2016年3月12日にアーカイブ。 2009年8月12日閲覧
  13. ^ Gembris, D.; Taylor, J.; Suter, D. (2002). 「陸上競技における傾向とランダム変動」 . Nature . 417 (6888): 506. Bibcode : 2002Natur.417..506G . doi : 10.1038 / 417506a . hdl : 2003/25362 . PMID 12037557. S2CID 13469470 .  
  14. ^ Gembris, D.; Taylor, J.; Suter, D. (2007). 「運動記録の進化:統計的効果と実質的な向上」. Journal of Applied Statistics . 34 (5): 529– 545. Bibcode : 2007JApSt..34..529G . doi : 10.1080/ 02664760701234850 . hdl : 2003/25404 . PMC 11134017. PMID 38817921. S2CID 55378036 .   
  15. ^ Spearing, H.; Tawn, J.; Irons, D.; Paulden, T.; Bennett, G. (2021). 「極値理論を用いたエリート水泳選手のランキングとその他の特性」 . Journal of the Royal Statistical Society . Series A (Statistics in Society). 184 (1): 368– 395. arXiv : 1910.10070 . doi : 10.1111/rssa.12628 . S2CID 204823947 . 
  16. ^ Songchitruksa, P.; Tarko, AP (2006). 「安全性推定への極値理論アプローチ」.事故分析・予防. 38 (4): 811– 822. doi : 10.1016/j.aap.2006.02.003 . PMID 16546103 . 
  17. ^ Orsini, F.; Gecchele, G.; Gastaldi, M.; Rossi, R. (2019). 「ラウンドアバウトにおける衝突予測:極値理論アプローチの比較研究」. Transportmetrica . シリーズA:輸送科学. 15 (2): 556– 572. doi : 10.1080/23249935.2018.1515271 . S2CID 158343873 . 
  18. ^ Tsinos, CG; Foukalas, F.; Khattab, T.; Lai, L. (2018年2月). 「キャリアアグリゲーションシステムにおけるチャネル選択について」. IEEE Transactions on Communications . 66 (2): 808– 818. Bibcode : 2018ITCom..66..808T . doi : 10.1109/TCOMM.2017.2757478 . S2CID 3405114 . 
  19. ^ Wong, Felix; Collins, James J. (2020年11月2日). 「コロナウイルスのスーパースプレッディングファットテール型であるという証拠」 . Proceedings of the National Academy of Sciences of the USA . 117 (47): 29416– 29418. Bibcode : 2020PNAS..11729416W . doi : 10.1073/pnas.2018490117 . ISSN 0027-8424 . PMC 7703634. PMID 33139561 .   
  20. ^ Basnayake, Kanishka; Mazaud, David; Bemelmans, Alexis; Rouach, Nathalie; Korkotian, Eduard; Holcman, David (2019年6月4日). 「極端統計量によって駆動れる樹状突起スパインにおける高速カルシウムトランジェント」 . PLOS Biology . 17 (6) e2006202. doi : 10.1371/journal.pbio.2006202 . ISSN 1545-7885 . PMC 6548358. PMID 31163024 .   
  21. ^ユニス, アブバカー; アブデルジャリル, アンワル; オメル, アリ (2023年1月1日). 「スーダンのオフグリッド太陽光発電システムにおけるピークスレッショルド法と短期データを用いたパネル発電係数の決定:ハルツーム市の事例」 .太陽エネルギー. 249 : 242– 249. Bibcode : 2023SoEn..249..242Y . doi : 10.1016/j.solener.2022.11.039 . ISSN 0038-092X . S2CID 254207549 .  
  22. ^ Fogg, Alexandra Ruth (2023). 「アイルランド、ヴァレンティア天文台における地上磁力計観測の極値解析」. Space Weather . 21 (e2023SW003565) e2023SW003565. Bibcode : 2023SpWea..2103565F . doi : 10.1029/2023SW003565 .
  23. ^ショーン・エルヴィッジ (2020). 「ヒルベルト・ホアン変換と極値理論を用いた地磁気活動の発生推定」 .宇宙天気. 17 (e2020SW002513) e2020SW002513. Bibcode : 2020SpWea..1802513E . doi : 10.1029/2020SW002513 .
  24. ^ Bergin, Aisling (2023). 「Dst、SYM-H、SMR地磁気指標における極端事象統計」. Space Weather . 21 (e2022SW003304) e2022SW003304. Bibcode : 2023SpWea..2103304B . doi : 10.1029/2022SW003304 . hdl : 10037/30641 .
  25. ^ Fogg, Alexandra Ruth; Healy, D.; Jackman, CM; Parnell, AC; Rutala, MJ; McEntee, SC; Walker, SJ; Gallagher, PT; Bowers, CF (2025年5月). 「宇宙天気リスク評価のための二変量極値解析:地球系における太陽風—磁気圏駆動」 . Space Weather . 23 (5) e2024SW004176. Bibcode : 2025SpWea..2304176F . doi : 10.1029/2024SW004176 .
  26. ^フィンケル、ジャスティン、ガーバー、エドウィン・P、アボット、ドリアン・S、ウェア、ジョナサン(2023年4月)。「短期天気予報データに隠された極端現象の統計を明らかにする」AGU Advances . 4 (2) e2023AV000881. arXiv : 2206.05363 . Bibcode : 2023AGUA....400881F . doi : 10.1029/2023AV000881 .
  27. ^ Healy, Dáire; Tawn, Jonathan; Thorne, Peter; Parnell, Andrew (2025年3月13日). 「気候変動下における極端な空間気温イベントの推論とアイルランドへの適用」 . Journal of the Royal Statistical Society Series C: Applied Statistics . 74 (2): 275– 299. doi : 10.1093/jrsssc/qlae047 .
  28. ^ガンベル(2004)
  29. ^ a b Morton, ID; Bowers, J. (1996年12月). 「多変量オフショア環境における極値分析」.応用海洋研究. 18 (6): 303– 317. Bibcode : 1996AppOR..18..303M . doi : 10.1016/s0141-1187(97)00007-2 . ISSN 0141-1187 . 
  30. ^ Beirlant, Jan; Goegebeur, Yuri; Teugels, Jozef; Segers, Johan (2004年8月27日). 『極値統計:理論と応用』 Wileyシリーズ 確率統計. 英国チチェスター: John Wiley & Sons, Ltd. doi : 10.1002/0470012382 . ISBN 978-0-470-01238-3
  31. ^コールズ、スチュアート (2001).極値の統計モデリング入門. シュプリンガー統計シリーズ. doi : 10.1007/978-1-4471-3675-0 . ISBN 978-1-84996-874-4. ISSN  0172-7397 .
  32. ^ de Carvalho, M.; Davison, AC (2014). 「多変量極値のためのスペクトル密度比モデル」 ( PDF) . Journal of the American Statistical Association . 109 : 764‒776. doi : 10.1016/j.spl.2017.03.030 . hdl : 20.500.11820/9e2f7cff-d052-452a-b6a2-dc8095c44e0c . S2CID 53338058 
  33. ^ Hanson, T.; de Carvalho, M.; Chen, Yuhui (2017). 「多変量極値分布のBernstein多項式角密度」(PDF) . Statistics and Probability Letters . 128 : 60–66 . doi : 10.1016/j.spl.2017.03.030 . hdl : 20.500.11820/9e2f7cff-d052-452a-b6a2-dc8095c44e0c . S2CID 53338058 . 
  34. ^ de Carvalho, M. (2013). 「二変量裾依存性に対するユークリッド尤度推定量」(PDF) . Communications in Statistics – Theory and Methods . 42 (7): 1176– 1192. arXiv : 1204.3524 . doi : 10.1080/03610926.2012.709905 . S2CID 42652601 . 
  35. ^ Zachary, S.; Feld, G.; Ward, G.; Wolfram, J. (1998年10月). 「沖合環境における多変量外挿」. Applied Ocean Research . 20 (5): 273– 295. Bibcode : 1998AppOR..20..273Z . doi : 10.1016/s0141-1187(98)00027-3 . ISSN 0141-1187 . 
  36. ^ Davison, AC; Smith, Richard (1990). 「高閾値超過モデル」 .英国王立統計学会誌. シリーズB(方法論). 52 (3): 393– 425. doi : 10.1111/j.2517-6161.1990.tb01796.x .
  37. ^ de Carvalho, M. (2016). 「極値の統計:課題と機会」EVTハンドブックとその金融・保険への応用(PDF)ホーボーケン、ニュージャージー州: John Wiley's Sons. pp.  195– 214. ISBN 978-1-118-65019-6
  38. ^ Castro, D.; de Carvalho, M.; Wadsworth, J. (2018). 「時間変動極値依存性と主要欧州株式市場への応用」 ( PDF) . Annals of Applied Statistics . 12 : 283–309 . doi : 10.1214/17-AOAS1089 . S2CID 33350408 
  39. ^ Mhalla, L.; de Carvalho, M.; Chavez-Demoulin, V. (2019). 「極値依存性の回帰型モデル」(PDF) . Scandinavian Journal of Statistics . 46 (4): 1141– 1167. arXiv : 1704.08447 . doi : 10.1111/sjos.12388 . S2CID 53570822 . 
  40. ^ Mhalla, L.; de Carvalho, M.; Chavez-Demoulin, V. (2018). 「Pickands依存関数の局所ロバスト推定」 Annals of Statistics . 46 (6A): 2806– 2843. doi : 10.1214/17-AOS1640 . S2CID 59467614 . 

出典

ソフトウェア

  • ヴァレリー・チャベス=デムーラン、アーミン・レーアール(2004年1月8日)。極値理論はあなたの命を救う(PDF)。risknet.de (レポート)。ドイツ— 数学を使わない簡単な入門。