ワルド方程式

確率論において、ワルド方程式ワルド恒等式[ 1 ]、またはワルドの補題[ 2 ]は、乱数の和の期待値の計算を簡素化する重要な恒等式である。最も単純な形では、これは、ランダムに生成された多数の有限平均、独立かつ同一分布に従う乱数変数の和の期待値と、和の項数の期待値、および和の項数が被加数に依存しないという条件下での乱数変数の共通期待値を関連付けるものである。

この方程式は数学者アブラハム・ウォルドにちなんで名付けられました。二次モーメントの恒等式はブラックウェル・ガーシック方程式によって与えられます。[ 3 ]

基本バージョン

( X n ) n ∈ を{\displaystyle \mathbb {N} }実数値で独立かつ同一分布に従う確率変数のとし、N ≥ 0 を列( X n ) n{\displaystyle \mathbb {N} }とは独立な整数値の確率変数とする。NとX nには有限の期待値があるとする。すると

E[X1++X]E[]E[X1]{\displaystyle \operatorname {E} [X_{1}+\dots +X_{N}]=\operatorname {E} [N]\operatorname {E} [X_{1}]\,.}

6面サイコロを1つ振ります。サイコロの目(Nとする)を取り、その数だけ6面サイコロを振り、X 1、…、X Nの値を出し、それぞれの値を合計します。ワルドの式により、平均すると以下のようになります。

E[]E[X]1+2+3+4+5+661+2+3+4+5+664413649412.25{\displaystyle \operatorname {E} [N]\operatorname {E} [X]={\frac {1+2+3+4+5+6}{6}}\cdot {\frac {1+2+3+4+5+6}{6}}={\frac {441}{36}}={\frac {49}{4}}=12.25\,.}

一般版

( X n ) n ∈ を{\displaystyle \mathbb {N} }実数値ランダム変数の無限列とし、N非負整数値ランダム変数とします。

次のことを前提とします。

1 . ( X n ) n{\displaystyle \mathbb {N} }はすべて積分可能な(有限平均)確率変数であり、
2 . E[ X n 1 { Nn } ] = E[ X n ] P( Nn ) (任意の自然数nに対して)であり、
3 . 無限級数は
n1E[|Xn|1{n}]<{\displaystyle \sum _{n=1}^{\infty }\operatorname {E} \!{\bigl [}|X_{n}|1_{\{N\geq n\}}{\bigr ]}<\infty .}

そしてランダムな合計

S:=n1XnT:=n1E[Xn]{\displaystyle S_{N}:=\sum _{n=1}^{N}X_{n},\qquad T_{N}:=\sum _{n=1}^{N}\operatorname {E} [X_{n}]}

積分可能であり、

E[S]E[T]{\displaystyle \operatorname {E} [S_{N}]=\operatorname {E} [T_{N}].}

さらに、

4 . ( X n ) n ∈ は{\displaystyle \mathbb {N} }すべて同じ期待値を持ち、
5 . Nは有限の期待値を持ち、

それから

E[S]E[]E[X1]{\displaystyle \operatorname {E} [S_{N}]=\operatorname {E} [N]\,\operatorname {E} [X_{1}].}

注:通常、ワルドの方程式という名前は、この最後の等式を指します。

仮定についての議論

明らかに、仮定( 1 )は仮定( 2 )とワルド方程式を定式化するために必要です。仮定( 2 )は、数列( Xn ) n∈{\displaystyle \mathbb {N} }項の数Nの間に許容される依存性の量を制御します。必要性については以下の反例を参照してください。仮定( 2 )は、Nが独立した確率変数数列( Xn ) n∈の停止時間 である場合に満たされることに注意してください 仮定( 3 )はより技術的な性質のものであり、絶対収束を意味し、したがって証明において無限級数の 任意の並べ替えを許容します。{\displaystyle \mathbb {N} }

仮定(5)が満たされる場合、仮定(3)はより単純な条件に強化することができる。

6 .すべての自然数nに対してE[| X n | 1 { Nn } ] ≤ C P( Nn )を満たす実定数Cが存在する。

実際、仮定(6)を用いると、

n1E[|Xn|1{n}]Cn1Pn{\displaystyle \sum _{n=1}^{\infty }\operatorname {E} \!{\bigl [}|X_{n}|1_{\{N\geq n\}}{\bigr ]}\leq C\sum _{n=1}^{\infty }\operatorname {P} (N\geq n),}

そして最後の級数はN の期待値に等しく[証明]、これは仮定( 5 )により有限である。したがって、( 5 )と( 6 )は仮定( 3 )を意味する。

( 1)と() に加えて、

7 . Nはシーケンス( X n ) n{\displaystyle \mathbb {N} }とは独立であり、
8 .すべての自然数nに対してE[| X n |]≤Cなる定数Cが存在する。

すると、すべての仮定( 1 )、( 2 )、( 5 )、( 6 )が満たされ、したがって( 3 )も満たされる。特に、条件( 4 )と( 8 )は、

9 . 確率変数( X n ) n ∈ は{\displaystyle \mathbb {N} }すべて同じ分布に従います。

シーケンス( X n ) n{\displaystyle \mathbb {N} }のランダム変数は独立である必要がないことに注意してください。

興味深い点は、項の乱数Nと数列( X n ) n{\displaystyle \mathbb {N} }の間に何らかの依存関係を認めることである。標準的なバージョンでは、( 1 )、( 5 )、( 8 )を仮定し、フィルトレーション( F n ) n0{\displaystyle \mathbb {N} }の存在を仮定して、

10 . Nは濾過に関する停止時間であり、
11. XnFn - 1はすべてのn∈に対して{\displaystyle \mathbb {N} }独立である。

すると、( 10 )は事象{ Nn } = { Nn – 1} cがF n –1に属することを意味しており、したがって( 11 )によりX nとは独立である。これは( 2 )を意味し、( 8 )と合わせて( 6 )を意味する。

便宜上(オプションの停止定理を用いた以下の証明を参照)、およびシーケンスX nn{\displaystyle \mathbb {N} }と濾過F nn0{\displaystyle \mathbb {N} }の関係を特定するために、次の追加の仮定がしばしば課されます。

12 . シーケンス( Xn ) n∈{\displaystyle \mathbb {N} }濾過( Fn ) n∈に適合しており、Xnすべてのn∈に対してFn測定可能あること意味する{\displaystyle \mathbb {N} }{\displaystyle \mathbb {N} }

( 11 )と( 12 )を合わせると確率変数( Xn ) n∈{\displaystyle \mathbb {N} }独立していることが分かる。

応用

請求総額が複合ポアソン過程に従うことを考慮すると、保険数理学の応用となる。

Sn1Xn{\displaystyle S_{N}=\sum _{n=1}^{N}X_{n}}

ある期間(例えば1年)内に、ランダムな数Nの個々の保険請求から生じる保険請求額を、ランダム変数( X n ) n{\displaystyle \mathbb {N} }で表します。上記の仮定の下では、年間平均請求件数と平均請求額に関する情報が利用可能な場合、ワルドの式を用いて期待される総請求額を計算できます。より強い仮定と、基礎となる分布に関するより多くの情報があれば、パンジャーの再帰を用いてS Nの分布を計算できます。

従属項の例

N を積分可能な0値のランダム変数とし、これはE[ Z ] = 0 となる積分可能な実数値ランダム変数Zとは独立とする。すべてのnに対してX n = (–1) n Zと定義する。すると、C  := E[| Z |]の場合の仮定 ( 1 )、( 5 )、( 7 )、( 8 )が満たされ、したがって ( 2 ) と ( 6 ) も満たされ、ワルドの式が適用される。 Zの分布が対称でない場合、( 9 ) は成立しない。Z がほぼ確実にゼロランダム変数に等しくない場合は、( 11 ) と ( 12 ) はどのフィルトレーション( F n ) nに対しても同時に成立しないことに注意してください。これは、 E[ Z 2 ] = (E[ Z ]) 2 = 0が不可能であるため、Z はそれ自身から独立できないためです。 {\displaystyle \mathbb {N} }{\displaystyle \mathbb {N} }{\displaystyle \mathbb {N} }

項の数が順序に依存する例

( X n ) n ∈ を{\displaystyle \mathbb {N} }、独立かつ対称で{–1, +1 } 値のランダム変数のシーケンスとします。すべてのn ∈に対して、 {\displaystyle \mathbb {N} }F n をX 1 , . . . , X nによって生成されたσ 代数とし、X nが値+1を取る最初のランダム変数であるとき、 N = nと定義します。P( N = n ) = 1/2 nであるため、比テストによりE[ N ] < ∞ となることに注意してください。仮定 ( 1 )、( 5 )、( 9 )、したがって ( 4 )、( 8 )、C = 1、 ( 10 )、( 11 )、( 12 ) が成り立ち、したがって ( 2 )、( 6 )、およびワルドの式も適用されます。ただし、 Nはシーケンス( X n ) nで定義されているため、( 7 ) は成り立ちません。この例では、 E[ S N ] > 0となると直感的に予想されるかもしれません。なぜなら、加算は1の直後で停止し、明らかに正のバイアスが生じるからです。しかし、ワルドの式は、この直感が誤解を招くことを示しています。 {\displaystyle \mathbb {N} }

反例

仮定の必要性を示す反例(2

iid (独立かつ同一に分布する確率変数)確率変数のシーケンスX nn{\displaystyle \mathbb {N} }を考えます。0と1の2つの値はそれぞれ確率 1/2(実際には、以下ではX 1のみが必要です) 。N = 1 – X 1と定義します。するとS N は0に等しいので、E[ S N ] = 0となりますが、E[ X 1 ] = 1/2そしてE[ N ] = 1/2であり、したがってワルド方程式は成立しない。確かに仮定( 1 )、( 3 )、( 4 )、( 5 )は満たされているが、仮定( 2 )の式はn = 1除くすべてのn∈{\displaystyle \mathbb {N} }に対して成立する。

仮定の必要性を示す反例(3

上記の2番目の例と非常によく似て、( Xn ) n∈{\displaystyle \mathbb {N} }独立した対称確率変数の列とします。ここで、Xn2n-2nのそれぞれ値を確率で 取ります1/2。NX n = 2 nとなる最初のn{\displaystyle \mathbb {N} }とする。すると、上と同様に、Nは有限の期待値を持つので、仮定( 5 )が成立する。すべてのn ∈についてE[ X n ] = 0なので、仮定( 1 )と( 4 )が成立する。しかし、 S N = 1がほぼ確実に成立するので、ワルドの方程式は成立しない。 {\displaystyle \mathbb {N} }

Nは( X n ) n{\displaystyle \mathbb {N} }によって生成される濾過に関する停止時間なので、仮定( 2 )が成り立つ(上記参照)。したがって、仮定( 3 )のみが成り立たない。実際、

{n}{X2 のために 1n1}{\displaystyle \{N\geq n\}=\{X_{i}=-2^{i}{\text{ for }}i=1,\ldots ,n-1\}}

したがって、すべてのn∈に対してP( N≥n )=1/ 2n - 1なるので、 {\displaystyle \mathbb {N} }

n1E[|Xn|1{n}]n12nPnn12{\displaystyle \sum _{n=1}^{\infty }\operatorname {E} \!{\bigl [}|X_{n}|1_{\{N\geq n\}}{\bigr ]}=\sum _{n=1}^{\infty }2^{n}\,\operatorname {P} (N\geq n)=\sum _{n=1}^{\infty }2=\infty .}

任意停止定理を用いた証明

( 1 )、( 5 )、( 8 )、( 10 )、( 11 )、( 12 )を仮定する。仮定( 1 )を用いて、確率変数の列を定義する。

Mn1nXE[X]n0{\displaystyle M_{n}=\sum _{i=1}^{n}(X_{i}-\operatorname {E} [X_{i}]),\quad n\in {\mathbb {N} }_{0}.}

仮定( 11 )は、 F n –1が与えられたときのX n条件付き期待値は、ほぼ確実に任意のn ∈に対してE[ X n ]に等しいことを意味する。したがって、仮定( 12 )により、 ( M n ) n0はフィルトレーション( F n ) n0に関してマルチンゲールである。仮定( 5 )、( 8 )、( 10 )は、オプション停止定理を適用できることを保証し、したがってM N = S NT Nは積分可能であり、 {\displaystyle \mathbb {N} }{\displaystyle \mathbb {N} }{\displaystyle \mathbb {N} }

仮定( 8) により、

|T||1E[X]|1E[|X|]C{\displaystyle |T_{N}|={\biggl |}\sum _{i=1}^{N}\operatorname {E} [X_{i}]{\biggr |}\leq \sum _{i=1}^{N}\operatorname {E} [|X_{i}|]\leq CN,}

そして仮定( 5 )により、この上限は積分可能である。したがって、式( 13 )の両辺にT Nの期待値を加えると、線形性により次式が得られる。

E[S]E[T]{\displaystyle \operatorname {E} [S_{N}]=\operatorname {E} [T_{N}].}

注意:この証明は従属項を含む上記の例をカバーしていないことに注意してください。

一般的な証明

この証明では、ルベーグの単調収束定理と優勢収束定理のみを用います。上記の命題を3つのステップで証明します。

ステップ1: ランダム和S Nの積分可能性

まずランダム和S Nが積分可能であることを示す。部分和を定義する。

Nは0でその値を取り、 S 0 = 0なので、 {\displaystyle \mathbb {N} }

|S|1|S|1{}{\displaystyle |S_{N}|=\sum _{i=1}^{\infty }|S_{i}|\,1_{\{N=i\}}.}

ルベーグの単調収束定理は、

E[|S|]1E[|S|1{}]{\displaystyle \operatorname {E} [|S_{N}|]=\sum _{i=1}^{\infty }\operatorname {E} [|S_{i}|\,1_{\{N=i\}}].}

三角不等式により、

|S|n1|Xn|{\displaystyle |S_{i}|\leq \sum _{n=1}^{i}|X_{n}|,\quad i\in {\mathbb {N} }.}

この上限推定値を使用し、合計の順序を変更すると(すべての項が非負であるため、これは可能です)、次の式が得られます。

ここで、2番目の不等式は単調収束定理を用いて導かれる。仮定( 3 )により、( 15 )の右辺の無限列は収束するため、 S Nは積分可能である。

ステップ2: ランダム和T Nの積分可能性

ランダム和T Nが積分可能であることを示す。部分和を定義する。

実数。Nは0その値を取り、 T 0 = 0なので、 {\displaystyle \mathbb {N} }

|T|1|T|1{}{\displaystyle |T_{N}|=\sum _{i=1}^{\infty }|T_{i}|\,1_{\{N=i\}}.}

ステップ1と同様に、ルベーグの単調収束定理は次式を意味する。

E[|T|]1|T|P{\displaystyle \operatorname {E} [|T_{N}|]=\sum _{i=1}^{\infty }|T_{i}|\operatorname {P} (N=i).}

三角不等式により、

|T|n1|E[Xn]|{\displaystyle |T_{i}|\leq \sum _{n=1}^{i}{\bigl |}\!\operatorname {E} [X_{n}]{\bigr |},\quad i\in {\mathbb {N} }.}

この上限推定値を使用し、合計の順序を変更すると(すべての項が非負であるため、これは可能です)、次の式が得られます。

仮定(2)によれば、

|E[Xn]|Pn|E[Xn1{n}]|E[|Xn|1{n}]n{\displaystyle {\bigl |}\!\operatorname {E} [X_{n}]{\bigr |}\operatorname {P} (N\geq n)={\bigl |}\!\operatorname {E} [X_{n}1_{\{N\geq n\}}]{\bigr |}\leq \operatorname {E} [|X_{n}|1_{\{N\geq n\}}],\quad n\in {\mathbb {N} }.}

これを(17) に代入すると

E[|T|]n1E[|Xn|1{n}]{\displaystyle \operatorname {E} [|T_{N}|]\leq \sum _{n=1}^{\infty }\operatorname {E} [|X_{n}|1_{\{N\geq n\}}],}

これは仮定( 3 )により有限なので、TN積分可能である。

ステップ3:本人確認

ワルドの方程式を証明するには、ランダム和S NT Nの積分可能性を利用して、絶対値なしで同じ手順をもう一度実行し、それらが同じ期待値を持つことを示します。

支配確率変数| S N |と( 14 ) で与えられた部分和S iの定義を用いた支配収束定理を用いると、

E[SN]=i=1E[Si1{N=i}]=i=1n=1iE[Xn1{N=i}].{\displaystyle \operatorname {E} [S_{N}]=\sum _{i=1}^{\infty }\operatorname {E} [S_{i}1_{\{N=i\}}]=\sum _{i=1}^{\infty }\sum _{n=1}^{i}\operatorname {E} [X_{n}1_{\{N=i\}}].}

( 15)で仮定( )を用いて絶対収束が証明されたので、和を整理すると次のようになる。

E[SN]=n=1i=nE[Xn1{N=i}]=n=1E[Xn1{Nn}],{\displaystyle \operatorname {E} [S_{N}]=\sum _{n=1}^{\infty }\sum _{i=n}^{\infty }\operatorname {E} [X_{n}1_{\{N=i\}}]=\sum _{n=1}^{\infty }\operatorname {E} [X_{n}1_{\{N\geq n\}}],}

ここで、仮定( 1 )と支配収束定理を用いて、支配確率変数| X n |を2番目の等式に用いた。仮定( 2 )と確率測度のσ加法性 により、

E[Xn1{Nn}]=E[Xn]P(Nn)=E[Xn]i=nP(N=i)=i=nE[E[Xn]1{N=i}].{\displaystyle {\begin{aligned}\operatorname {E} [X_{n}1_{\{N\geq n\}}]&=\operatorname {E} [X_{n}]\operatorname {P} (N\geq n)\\&=\operatorname {E} [X_{n}]\sum _{i=n}^{\infty }\operatorname {P} (N=i)=\sum _{i=n}^{\infty }\operatorname {E} \!{\bigl [}\operatorname {E} [X_{n}]1_{\{N=i\}}{\bigr ]}.\end{aligned}}}

この結果を前の式に代入し、期待値の線形性と( 16 )で与えられた期待値の部分和T iの定義を用いて、和を整理し直すと(これは絶対収束により許される。上記(15 )を参照) 、

E[SN]=i=1n=1iE[E[Xn]1{N=i}]=i=1E[Ti1{N=i}=TN1{N=i}].{\displaystyle \operatorname {E} [S_{N}]=\sum _{i=1}^{\infty }\sum _{n=1}^{i}\operatorname {E} \!{\bigl [}\operatorname {E} [X_{n}]1_{\{N=i\}}{\bigr ]}=\sum _{i=1}^{\infty }\operatorname {E} [\underbrace {T_{i}1_{\{N=i\}}} _{=\,T_{N}1_{\{N=i\}}}].}

支配収束を支配確率変数| T N |で再び用いると、

E[SN]=E[TNi=11{N=i}=1{N1}]=E[TN].{\displaystyle \operatorname {E} [S_{N}]=\operatorname {E} \!{\biggl [}T_{N}\underbrace {\sum _{i=1}^{\infty }1_{\{N=i\}}} _{=\,1_{\{N\geq 1\}}}{\biggr ]}=\operatorname {E} [T_{N}].}

仮定(4)と(5)が満たされる場合、期待値の線形性により、

E[TN]=E[n=1NE[Xn]]=E[X1]E[n=1N1=N]=E[N]E[X1].{\displaystyle \operatorname {E} [T_{N}]=\operatorname {E} \!{\biggl [}\sum _{n=1}^{N}\operatorname {E} [X_{n}]{\biggr ]}=\operatorname {E} [X_{1}]\operatorname {E} \!{\biggl [}\underbrace {\sum _{n=1}^{N}1} _{=\,N}{\biggr ]}=\operatorname {E} [N]\operatorname {E} [X_{1}].}

これで証明は完了です。

さらなる一般化

  • ワルドの方程式は、1次元バージョンをすべての要素に適用することで、R d値のランダム変数( X n ) nN{\displaystyle \mathbb {N} }に変換できます。
  • ( X n ) nN{\displaystyle \mathbb {N} }がバナッハ空間で値を取るボホナー積分可能確率変数である場合、上記の一般的な証明はそれに応じて調整することができます。

参照

注記

  1. ^ Janssen, Jacques; Manca, Raimondo (2006). 「再生理論」.応用セミマルコフ過程. Springer. pp.  45–104 . doi : 10.1007/0-387-29548-8_2 . ISBN 0-387-29547-X
  2. ^ Thomas Bruss, F.; Robertson, JB (1991). "iidランダム変数順序統計量の和に対する『ワルドの補題』」。応用確率論の進歩。23 3):612–623。doi10.2307/ 1427625。JSTOR 1427625。S2CID 120678340  
  3. ^ Blackwell, D.; Girshick, MA (1946). 「独立確率ベクトルの列の関数とk次元における「ランダムウォーク」問題への応用について」 . Ann. Math. Statist . 17 (3): 310– 317. doi : 10.1214/aoms/1177730943 .

参考文献