確率論 において、ワルド方程式 、ワルド恒等式 [ 1 ] 、またはワルドの補題 [ 2 ] は、乱数の和の期待値 の計算を簡素化する重要な恒等式である。最も単純な形では、これは、ランダムに生成された多数の有限平均、 独立かつ同一分布に従う乱数変数の和の期待値と、和の項数の期待値、および和の項数が被加数に 依存しない という条件下での乱数変数の共通期待値を関連付けるものである。
この方程式は数学者 アブラハム・ウォルド にちなんで名付けられました。二次モーメントの恒等式はブラックウェル・ガーシック方程式 によって与えられます。[ 3 ]
基本バージョン ( X n ) n ∈ を北 {\displaystyle \mathbb {N} } 実数値で独立かつ同一分布に従う確率変数の列 とし、N ≥ 0 を 列( X n ) n ∈北 {\displaystyle \mathbb {N} } とは独立な整数値の確率変数とする。NとX n には有限の期待値があるとする。すると 、
E [ X 1 + ⋯ + X 北 ] = E [ 北 ] E [ X 1 ] 。 {\displaystyle \operatorname {E} [X_{1}+\dots +X_{N}]=\operatorname {E} [N]\operatorname {E} [X_{1}]\,.}
例 6面サイコロ を1つ振ります。サイコロの目(N とする)を取り、その数だけ6面サイコロを振り、X 1 、…、X N の値を出し、それぞれの値を合計します。ワルドの式により、平均すると以下のようになります。
E [ 北 ] E [ X ] = 1 + 2 + 3 + 4 + 5 + 6 6 ⋅ 1 + 2 + 3 + 4 + 5 + 6 6 = 441 36 = 49 4 = 12.25 。 {\displaystyle \operatorname {E} [N]\operatorname {E} [X]={\frac {1+2+3+4+5+6}{6}}\cdot {\frac {1+2+3+4+5+6}{6}}={\frac {441}{36}}={\frac {49}{4}}=12.25\,.}
一般版 ( X n ) n ∈ を北 {\displaystyle \mathbb {N} } 実数値ランダム変数の無限列とし、Nを 非負整数値ランダム変数とします。
次のことを前提とします。
1 . ( X n ) n ∈北 {\displaystyle \mathbb {N} } はすべて積分可能な (有限平均)確率変数であり、2 . E[ X n 1 { N ≥ n } ] = E[ X n ] P( N ≥ n ) (任意の 自然数 n に対して)であり、3 . 無限級数は∑ n = 1 ∞ E [ | X n | 1 { 北 ≥ n } ] < ∞ 。 {\displaystyle \sum _{n=1}^{\infty }\operatorname {E} \!{\bigl [}|X_{n}|1_{\{N\geq n\}}{\bigr ]}<\infty .} そしてランダムな合計
S 北 := ∑ n = 1 北 X n 、 T 北 := ∑ n = 1 北 E [ X n ] {\displaystyle S_{N}:=\sum _{n=1}^{N}X_{n},\qquad T_{N}:=\sum _{n=1}^{N}\operatorname {E} [X_{n}]} 積分可能であり、
E [ S 北 ] = E [ T 北 ] 。 {\displaystyle \operatorname {E} [S_{N}]=\operatorname {E} [T_{N}].} さらに、
4 . ( X n ) n ∈ は北 {\displaystyle \mathbb {N} } すべて同じ期待値を持ち、5 . N は有限の期待値を持ち、それから
E [ S 北 ] = E [ 北 ] E [ X 1 ] 。 {\displaystyle \operatorname {E} [S_{N}]=\operatorname {E} [N]\,\operatorname {E} [X_{1}].} 注:通常、 ワルドの方程式という 名前は、この最後の等式を指します。
仮定についての議論 明らかに、仮定( 1 )は仮定( 2 )とワルド方程式を定式化するために必要です。仮定( 2 )は、数列( Xn ) n∈ と 北 {\displaystyle \mathbb {N} } 項の数N の間に許容される依存性の量を制御します。必要性については 、 以下の反例を 参照してください。仮定( 2 )は、 Nが 独立した確率変数数列( Xn ) n∈ の停止時間 である場合に満たされることに注意してください 。 仮定( 3 )はより技術的な性質のものであり、絶対収束を 意味し、したがって証明において無限級数の 任意の並べ替えを許容します。 北 {\displaystyle \mathbb {N} }
仮定(5 )が満たされる場合、仮定(3 )はより単純な条件に強化することができる。
6 .すべての自然数n に対してE[| X n | 1 { N ≥ n } ] ≤ C P( N ≥ n ) を満たす実定数C が存在する。実際、仮定(6 )を用いると、
∑ n = 1 ∞ E [ | X n | 1 { 北 ≥ n } ] ≤ C ∑ n = 1 ∞ P ( 北 ≥ n ) 、 {\displaystyle \sum _{n=1}^{\infty }\operatorname {E} \!{\bigl [}|X_{n}|1_{\{N\geq n\}}{\bigr ]}\leq C\sum _{n=1}^{\infty }\operatorname {P} (N\geq n),} そして最後の級数はN の期待値に等しく[証明 ] 、これは仮定( 5 )により有限である。したがって、( 5 )と( 6 )は仮定( 3 )を意味する。
( 1 )と(5 ) に加えて、
7 . N はシーケンス( X n ) n ∈北 {\displaystyle \mathbb {N} } とは独立であり、8 .すべての自然数n に対してE[| X n |]≤C と なる定数C が存在する。すると、すべての仮定( 1 )、( 2 )、( 5 )、( 6 )が満たされ、したがって( 3 )も満たされる。特に、条件( 4 )と( 8 )は、
9 . 確率変数( X n ) n ∈ は北 {\displaystyle \mathbb {N} } すべて同じ分布に従います。シーケンス( X n ) n ∈北 {\displaystyle \mathbb {N} } のランダム変数は独立である必要がないことに注意してください。
興味深い点は、項の乱数N と数列( X n ) n ∈北 {\displaystyle \mathbb {N} } の間に何らかの依存関係を認めることである。標準的なバージョンでは、( 1 )、( 5 )、( 8 )を仮定し、フィルトレーション ( F n ) n ∈ 0 北 {\displaystyle \mathbb {N} } の存在を仮定して、
10 . N は濾過に関する停止時間であり、 11. Xnと Fn - 1 はすべてのn∈ に対して 北 {\displaystyle \mathbb {N} } 独立である。すると、( 10 )は事象{ N ≥ n } = { N ≤ n – 1} cが F n –1 に属することを意味しており、したがって( 11 )により X n とは独立である。これは( 2 )を意味し、( 8 )と合わせて( 6 )を意味する。
便宜上(オプションの停止定理を用いた以下の証明を参照)、およびシーケンス(X n )n ∈北 {\displaystyle \mathbb {N} } と濾過(F n )n ∈ 0 北 {\displaystyle \mathbb {N} } の関係を特定するために、次の追加の仮定がしばしば課されます。
12 . シーケンス( Xn ) n∈ は北 {\displaystyle \mathbb {N} } 濾過( Fn ) n∈ に適合して おり、Xn は すべてのn∈ に対して Fn測定可能で ある ことを 意味 する 。北 {\displaystyle \mathbb {N} } 北 {\displaystyle \mathbb {N} } ( 11 )と( 12 )を合わせると 、 確率変数( Xn ) n∈ が北 {\displaystyle \mathbb {N} } 独立していることが分かる。
応用 請求総額が複合ポアソン過程に従うことを考慮すると、 保険数理学 の応用となる。
S 北 = ∑ n = 1 北 X n {\displaystyle S_{N}=\sum _{n=1}^{N}X_{n}} ある期間(例えば1年)内に、ランダムな数N の個々の保険請求から生じる保険請求額を、ランダム変数( X n ) n ∈北 {\displaystyle \mathbb {N} } で表します。上記の仮定の下では、年間平均請求件数と平均請求額に関する情報が利用可能な場合、ワルドの式を用いて期待される総請求額を計算できます。より強い仮定と、基礎となる分布に関するより多くの情報があれば、パンジャーの再帰を用いて S N の分布を計算できます。
例
従属項の例 N を 積分可能な0 値のランダム変数とし、これはE[ Z ] = 0 と なる積分可能な実数値ランダム変数Z とは独立とする。すべてのn ∈ に対してX n = (–1) n Z と定義する。すると、C := E[| Z |] の場合の仮定 ( 1 )、( 5 )、( 7 )、( 8 )が満たされ、したがって ( 2 ) と ( 6 ) も満たされ、ワルドの式が適用される。 Z の分布が対称でない場合、( 9 ) は成立しない。Z が ほぼ確実にゼロランダム変数に等しくない場合は、( 11 ) と ( 12 ) はどのフィルトレーション( F n ) n ∈ に対しても同時に成立しないことに注意してください。これは、 E[ Z 2 ] = (E[ Z ]) 2 = 0 が不可能であるため、Z は それ自身から独立できないためです。 北 {\displaystyle \mathbb {N} } 北 {\displaystyle \mathbb {N} } 北 {\displaystyle \mathbb {N} }
項の数が順序に依存する例 ( X n ) n ∈ を北 {\displaystyle \mathbb {N} } 、独立かつ対称で{–1, +1 } 値のランダム変数のシーケンスとします。すべてのn ∈に対して、 北 {\displaystyle \mathbb {N} } F n を X 1 , . . . , X n によって生成されたσ 代数 とし、X n が値+1 を取る最初のランダム変数であるとき、 N = n と定義します。P( N = n ) = 1/2 n であるため、比テスト によりE[ N ] < ∞ となる ことに注意してください。仮定 ( 1 )、( 5 )、( 9 )、したがって ( 4 )、( 8 )、C = 1 、 ( 10 )、( 11 )、( 12 ) が成り立ち、したがって ( 2 )、( 6 )、およびワルドの式も適用されます。ただし、 N はシーケンス( X n ) n ∈ で定義されているため、( 7 ) は成り立ちません。この例では、 E[ S N ] > 0 となると直感的に予想されるかもしれません。なぜなら、加算は1の直後で停止し、明らかに正のバイアスが生じるからです。しかし、ワルドの式は、この直感が誤解を招くことを示しています。 北 {\displaystyle \mathbb {N} }
反例 iid (独立かつ同一に分布する確率変数)確率変数のシーケンス(X n )n ∈北 {\displaystyle \mathbb {N} } を考えます。0と1の2つの値はそれぞれ確率 1 / 2 (実際には、以下ではX 1のみが必要です) 。N = 1 – X 1 と定義します。するとS N は 0に等しいので、E[ S N ] = 0 となりますが、E[ X 1 ] = 1 / 2 そしてE[ N ] = 1 / 2 であり、したがってワルド方程式は成立しない。確かに仮定( 1 )、( 3 )、( 4 )、( 5 )は満たされているが、仮定( 2 )の式はn = 1 を 除くすべてのn∈ 北 {\displaystyle \mathbb {N} } に対して成立する。
上記の2番目の例と非常によく似て、( Xn ) n∈ を北 {\displaystyle \mathbb {N} } 独立した対称確率変数の列とします。ここで、Xn は2n と -2nのそれぞれ の 値を確率 で 取ります。 1 / 2 。Nを X n = 2 n となる最初のn ∈北 {\displaystyle \mathbb {N} } とする。すると、上と同様に、Nは 有限の期待値を持つので、仮定( 5 )が成立する。すべてのn ∈について E[ X n ] = 0 なので、仮定( 1 )と( 4 )が成立する。しかし、 S N = 1が ほぼ確実に成立するので、ワルドの方程式は成立しない。 北 {\displaystyle \mathbb {N} }
N は( X n ) n ∈北 {\displaystyle \mathbb {N} } によって生成される濾過に関する停止時間なので、仮定( 2 )が成り立つ(上記参照)。したがって、仮定( 3 )のみが成り立たない。実際、
{ 北 ≥ n } = { X 私 = − 2 私 のために 私 = 1 、 … 、 n − 1 } {\displaystyle \{N\geq n\}=\{X_{i}=-2^{i}{\text{ for }}i=1,\ldots ,n-1\}} したがって、すべての n∈ に対してP( N≥n )=1/ 2n - 1 と なるので、 北 {\displaystyle \mathbb {N} }
∑ n = 1 ∞ E [ | X n | 1 { 北 ≥ n } ] = ∑ n = 1 ∞ 2 n P ( 北 ≥ n ) = ∑ n = 1 ∞ 2 = ∞ 。 {\displaystyle \sum _{n=1}^{\infty }\operatorname {E} \!{\bigl [}|X_{n}|1_{\{N\geq n\}}{\bigr ]}=\sum _{n=1}^{\infty }2^{n}\,\operatorname {P} (N\geq n)=\sum _{n=1}^{\infty }2=\infty .}
任意停止定理を用いた証明 ( 1 )、( 5 )、( 8 )、( 10 )、( 11 )、( 12 )を仮定する。仮定( 1 )を用いて、確率変数の列を定義する。
M n = ∑ 私 = 1 n ( X 私 − E [ X 私 ] ) 、 n ∈ 北 0 。 {\displaystyle M_{n}=\sum _{i=1}^{n}(X_{i}-\operatorname {E} [X_{i}]),\quad n\in {\mathbb {N} }_{0}.} 仮定( 11 )は、 F n –1 が与えられたときのX n の条件付き期待値 は、ほぼ確実に任意のn ∈に対して E[ X n ] に等しいことを意味する。したがって、仮定( 12 )により、 ( M n ) n ∈ 0 はフィルトレーション( F n ) n ∈ 0 に関してマルチンゲール である。仮定( 5 )、( 8 )、( 10 )は、オプション停止定理 を適用できることを保証し、したがってM N = S N – T N は積分可能であり、 北 {\displaystyle \mathbb {N} } 北 {\displaystyle \mathbb {N} } 北 {\displaystyle \mathbb {N} }
E [ S 北 − T 北 ] = E [ M 0 ] = 0。 {\displaystyle \operatorname {E} [S_{N}-T_{N}]=\operatorname {E} [M_{0}]=0.} 13
仮定( 8 ) により、
| T 北 | = | ∑ 私 = 1 北 E [ X 私 ] | ≤ ∑ 私 = 1 北 E [ | X 私 | ] ≤ C 北 、 {\displaystyle |T_{N}|={\biggl |}\sum _{i=1}^{N}\operatorname {E} [X_{i}]{\biggr |}\leq \sum _{i=1}^{N}\operatorname {E} [|X_{i}|]\leq CN,} そして仮定( 5 )により、この上限は積分可能である。したがって、式( 13 )の両辺にT N の期待値を加えると、線形性により次式が得られる。
E [ S 北 ] = E [ T 北 ] 。 {\displaystyle \operatorname {E} [S_{N}]=\operatorname {E} [T_{N}].} 注意:この証明は 従属項を含む上記の例 をカバーしていないことに注意してください。
一般的な証明 この証明では、ルベーグの単調収束 定理と優勢収束定理 のみを用います。上記の命題を3つのステップで証明します。
ステップ1: ランダム和S Nの積分可能性 まずランダム和S N が積分可能であることを示す。部分和を定義する。
S 私 = ∑ n = 1 私 X n 、 私 ∈ 北 0 。 {\displaystyle S_{i}=\sum _{n=1}^{i}X_{n},\quad i\in {\mathbb {N} }_{0}.} 14
Nは 0 でその値を取り、 S 0 = 0 なので、 北 {\displaystyle \mathbb {N} }
| S 北 | = ∑ 私 = 1 ∞ | S 私 | 1 { 北 = 私 } 。 {\displaystyle |S_{N}|=\sum _{i=1}^{\infty }|S_{i}|\,1_{\{N=i\}}.} ルベーグの単調収束定理 は、
E [ | S 北 | ] = ∑ 私 = 1 ∞ E [ | S 私 | 1 { 北 = 私 } ] 。 {\displaystyle \operatorname {E} [|S_{N}|]=\sum _{i=1}^{\infty }\operatorname {E} [|S_{i}|\,1_{\{N=i\}}].} 三角不等式により、
| S 私 | ≤ ∑ n = 1 私 | X n | 、 私 ∈ 北 。 {\displaystyle |S_{i}|\leq \sum _{n=1}^{i}|X_{n}|,\quad i\in {\mathbb {N} }.} この上限推定値を使用し、合計の順序を変更すると(すべての項が非負であるため、これは可能です)、次の式が得られます。
E [ | S 北 | ] ≤ ∑ n = 1 ∞ ∑ 私 = n ∞ E [ | X n | 1 { 北 = 私 } ] = ∑ n = 1 ∞ E [ | X n | 1 { 北 ≥ n } ] 、 {\displaystyle \operatorname {E} [|S_{N}|]\leq \sum _{n=1}^{\infty }\sum _{i=n}^{\infty }\operatorname {E} [|X_{n}|\,1_{\{N=i\}}]=\sum _{n=1}^{\infty }\operatorname {E} [|X_{n}|\,1_{\{N\geq n\}}],} 15
ここで、2番目の不等式は単調収束定理を用いて導かれる。仮定( 3 )により、( 15 )の右辺の無限列は収束するため、 S N は積分可能である。
ステップ2: ランダム和T Nの積分可能性 ランダム和T N が積分可能であることを示す。部分和を定義する。
T 私 = ∑ n = 1 私 E [ X n ] 、 私 ∈ 北 0 、 {\displaystyle T_{i}=\sum _{n=1}^{i}\operatorname {E} [X_{n}],\quad i\in {\mathbb {N} }_{0},} 16
実数。Nは0 で その値を取り、 T 0 = 0 なので、 北 {\displaystyle \mathbb {N} }
| T 北 | = ∑ 私 = 1 ∞ | T 私 | 1 { 北 = 私 } 。 {\displaystyle |T_{N}|=\sum _{i=1}^{\infty }|T_{i}|\,1_{\{N=i\}}.} ステップ1と同様に、ルベーグの単調収束定理は 次式を意味する。
E [ | T 北 | ] = ∑ 私 = 1 ∞ | T 私 | P ( 北 = 私 ) 。 {\displaystyle \operatorname {E} [|T_{N}|]=\sum _{i=1}^{\infty }|T_{i}|\operatorname {P} (N=i).} 三角不等式により、
| T 私 | ≤ ∑ n = 1 私 | E [ X n ] | 、 私 ∈ 北 。 {\displaystyle |T_{i}|\leq \sum _{n=1}^{i}{\bigl |}\!\operatorname {E} [X_{n}]{\bigr |},\quad i\in {\mathbb {N} }.} この上限推定値を使用し、合計の順序を変更すると(すべての項が非負であるため、これは可能です)、次の式が得られます。
E [ | T 北 | ] ≤ ∑ n = 1 ∞ | E [ X n ] | ∑ 私 = n ∞ P ( 北 = 私 ) ⏟ = P ( 北 ≥ n ) 、 {\displaystyle \operatorname {E} [|T_{N}|]\leq \sum _{n=1}^{\infty }{\bigl |}\!\operatorname {E} [X_{n}]{\bigr |}\underbrace {\sum _{i=n}^{\infty }\operatorname {P} (N=i)} _{=\,\operatorname {P} (N\geq n)},} 17
仮定(2 )によれば、
| E [ X n ] | P ( 北 ≥ n ) = | E [ X n 1 { 北 ≥ n } ] | ≤ E [ | X n | 1 { 北 ≥ n } ] 、 n ∈ 北 。 {\displaystyle {\bigl |}\!\operatorname {E} [X_{n}]{\bigr |}\operatorname {P} (N\geq n)={\bigl |}\!\operatorname {E} [X_{n}1_{\{N\geq n\}}]{\bigr |}\leq \operatorname {E} [|X_{n}|1_{\{N\geq n\}}],\quad n\in {\mathbb {N} }.} これを(17 ) に代入すると
E [ | T 北 | ] ≤ ∑ n = 1 ∞ E [ | X n | 1 { 北 ≥ n } ] 、 {\displaystyle \operatorname {E} [|T_{N}|]\leq \sum _{n=1}^{\infty }\operatorname {E} [|X_{n}|1_{\{N\geq n\}}],} これは仮定( 3 )により有限なので、TNは 積分可能である。
ステップ3:本人確認 ワルドの方程式を証明するには、ランダム和S N とT N の積分可能性を利用して、絶対値 なしで同じ手順をもう一度実行し、それらが同じ期待値を持つことを示します。
支配確率変数| S N | と( 14 ) で与えられた部分和S i の定義を用いた支配収束定理 を用いると、
E [ S N ] = ∑ i = 1 ∞ E [ S i 1 { N = i } ] = ∑ i = 1 ∞ ∑ n = 1 i E [ X n 1 { N = i } ] . {\displaystyle \operatorname {E} [S_{N}]=\sum _{i=1}^{\infty }\operatorname {E} [S_{i}1_{\{N=i\}}]=\sum _{i=1}^{\infty }\sum _{n=1}^{i}\operatorname {E} [X_{n}1_{\{N=i\}}].} ( 15 )で仮定(3 )を用いて絶対収束が証明されたので、和を整理すると次のようになる。
E [ S N ] = ∑ n = 1 ∞ ∑ i = n ∞ E [ X n 1 { N = i } ] = ∑ n = 1 ∞ E [ X n 1 { N ≥ n } ] , {\displaystyle \operatorname {E} [S_{N}]=\sum _{n=1}^{\infty }\sum _{i=n}^{\infty }\operatorname {E} [X_{n}1_{\{N=i\}}]=\sum _{n=1}^{\infty }\operatorname {E} [X_{n}1_{\{N\geq n\}}],} ここで、仮定( 1 )と支配収束定理を用いて、支配確率変数| X n |を2番目の等式に用いた。仮定( 2 )と確率測度のσ加法性 により、
E [ X n 1 { N ≥ n } ] = E [ X n ] P ( N ≥ n ) = E [ X n ] ∑ i = n ∞ P ( N = i ) = ∑ i = n ∞ E [ E [ X n ] 1 { N = i } ] . {\displaystyle {\begin{aligned}\operatorname {E} [X_{n}1_{\{N\geq n\}}]&=\operatorname {E} [X_{n}]\operatorname {P} (N\geq n)\\&=\operatorname {E} [X_{n}]\sum _{i=n}^{\infty }\operatorname {P} (N=i)=\sum _{i=n}^{\infty }\operatorname {E} \!{\bigl [}\operatorname {E} [X_{n}]1_{\{N=i\}}{\bigr ]}.\end{aligned}}} この結果を前の式に代入し、期待値の線形性と( 16 )で与えられた期待値の部分和T i の定義を用いて、和を整理し直すと(これは絶対収束により許される。上記(15 )を参照) 、
E [ S N ] = ∑ i = 1 ∞ ∑ n = 1 i E [ E [ X n ] 1 { N = i } ] = ∑ i = 1 ∞ E [ T i 1 { N = i } ⏟ = T N 1 { N = i } ] . {\displaystyle \operatorname {E} [S_{N}]=\sum _{i=1}^{\infty }\sum _{n=1}^{i}\operatorname {E} \!{\bigl [}\operatorname {E} [X_{n}]1_{\{N=i\}}{\bigr ]}=\sum _{i=1}^{\infty }\operatorname {E} [\underbrace {T_{i}1_{\{N=i\}}} _{=\,T_{N}1_{\{N=i\}}}].} 支配収束を支配確率変数| T N | で再び用いると、
E [ S N ] = E [ T N ∑ i = 1 ∞ 1 { N = i } ⏟ = 1 { N ≥ 1 } ] = E [ T N ] . {\displaystyle \operatorname {E} [S_{N}]=\operatorname {E} \!{\biggl [}T_{N}\underbrace {\sum _{i=1}^{\infty }1_{\{N=i\}}} _{=\,1_{\{N\geq 1\}}}{\biggr ]}=\operatorname {E} [T_{N}].} 仮定(4 )と(5 )が満たされる場合、期待値の線形性により、
E [ T N ] = E [ ∑ n = 1 N E [ X n ] ] = E [ X 1 ] E [ ∑ n = 1 N 1 ⏟ = N ] = E [ N ] E [ X 1 ] . {\displaystyle \operatorname {E} [T_{N}]=\operatorname {E} \!{\biggl [}\sum _{n=1}^{N}\operatorname {E} [X_{n}]{\biggr ]}=\operatorname {E} [X_{1}]\operatorname {E} \!{\biggl [}\underbrace {\sum _{n=1}^{N}1} _{=\,N}{\biggr ]}=\operatorname {E} [N]\operatorname {E} [X_{1}].} これで証明は完了です。
さらなる一般化 ワルドの方程式は、1次元バージョンをすべての要素に適用することで、R d 値のランダム変数( X n ) n ∈N {\displaystyle \mathbb {N} } に変換できます。 ( X n ) n ∈N {\displaystyle \mathbb {N} } がバナッハ空間で値を取る ボホナー積分可能 確率変数である場合、上記の一般的な証明はそれに応じて調整することができます。
参照
注記
参考文献
外部リンク