モーメント(数学)

数学における関数モーメントとは、関数のグラフの形状に関連する特定の定量的な尺度です。例えば、関数が質量密度を表す場合、ゼロ次モーメントは全質量、第1モーメント(全質量で正規化)は質量中心、第2モーメントは慣性モーメントです。関数が確率分布の場合、第1モーメントは期待値、第2中心モーメント分散、第3標準化モーメント歪度、第4標準化モーメントは尖度です。

質量または確率の分布が有界区間上にある場合、すべてのモーメント(0からまでのすべての次数)の集合によって、その分布は一意に決定されます(ハウスドルフモーメント問題)。しかし、無界区間では同じことは成り立ちません(ハンバーガーモーメント問題)。

19世紀半ば、パフヌティ・チェビシェフはランダム変数のモーメントについて体系的に考えた最初の人物となった。[ 1 ]

瞬間の重要性

密度関数を持つ確率変数のn次モーメント(つまり、ゼロの周りのモーメント)は次ように定義される[ 2 ]。密度関数を持つ数値連続確率変数のn次のモーメントは積分X{\displaystyle X}f×{\displaystyle f(x)}μnXn def {×nf×離散分布×nf×d×連続分布{\displaystyle \mu '_{n}=\langle X^{n}\rangle ~{\overset {\mathrm {def} }{=}}~{\begin{cases}\sum _{i}x_{i}^{n}f(x_{i}),&{\text{離散分布}}\\[1.2ex]\int x^{n}f(x)\,dx,&{\text{連続分布}}\end{cases}}}f×{\displaystyle f(x)}c{\displaystyle c}μn×cnf×d×{\displaystyle \mu _{n}=\int _{-\infty }^{\infty }(xc)^{n}\,f(x)\,\mathrm {d} x.}

実数値関数のモーメントよりも一般的な方法で、確率変数のモーメントを定義することが可能です。距離空間におけるモーメントを参照してください。関数のモーメントとは、特に説明がない場合、通常は上記の式を指します。2次モーメント以上のモーメントについては、分布の形状に関するより明確な情報を提供するため、通常、ゼロ周りのモーメントではなく、中心モーメント(平均周りのモーメント、cは平均)が使用されます。 c0{\displaystyle c=0}

他のモーメントも定義される。例えば、ゼロの周りのn次の逆モーメントは、ゼロの周りのn次の対数モーメントは、E[Xn]{\displaystyle \operatorname {E} \left[X^{-n}\right]}E[lnnX]{\displaystyle \operatorname {E} \left[\ln ^{n}(X)\right].}

確率密度関数のゼロ周りのn次のモーメントはの期待値であり、生モーメントまたは粗モーメントと呼ばれる。[ 3 ]平均周りのモーメントは中心モーメントと呼ばれ、並進とは独立して関数の形状を記述する。 f×{\displaystyle f(x)}Xn{\displaystyle X^{n}}μ{\displaystyle \mu}

が確率密度関数である場合、上記の積分の値は確率分布のn次モーメントと呼ばれます。より一般的には、F が密度関数を持たない可能性のある任意の確率分布の累積確率分布関数である場合、確率分布のn次モーメントはリーマン–スティルチェス積分で与えられ、ここでXはこの累積分布Fを持つランダム変数Eは期待値演算子または平均です。モーメントが存在しないと言われます。任意の点についてのn次モーメントが存在する場合、すべての点についての( n − 1)次モーメント (およびすべての低次のモーメント) も存在します。任意の確率密度関数のゼロ次モーメントは1です。これは、任意の確率密度関数の下の面積が1 に等しくなければならないためです。 f{\displaystyle f}μnE[Xn]×ndF×{\displaystyle \mu '_{n}=\operatorname {E} \left[X^{n}\right]=\int _{-\infty }^{\infty }x^{n}\,\mathrm {d} F(x)}E[|Xn|]|×n|dF×{\displaystyle \operatorname {E} \left[\left|X^{n}\right|\right]=\int _{-\infty }^{\infty }\left|x^{n}\right|\,\mathrm {d} F(x)=\infty }

分布の指定された特性と関連したモーメント(生、中心、標準化)とキュムラント(生、正規化)の重要性
モーメント順序 一瞬 キュムラント
中央 標準化された 正規化
1平均00平均該当なし
2分散1分散1
3歪度歪度
4(非過剰または歴史的)尖度過剰尖度
5超歪度
6ハイパーテールネス
7歳以上

標準化された瞬間

正規n次中心モーメントまたは標準化モーメントは、n次中心モーメントをσnで割ったものである確率変数Xの正規化n次中心モーメントは、μnσnE[Xμn]σnE[Xμn]E[Xμ2]n2{\displaystyle {\frac {\mu _{n}}{\sigma ^{n}}}={\frac {\operatorname {E} \left[(X-\mu )^{n}\right]}{\sigma ^{n}}}={\frac {\operatorname {E} \left[(X-\mu )^{n}\right]}{\operatorname {E} \left[(X-\mu )^{2}\right]^{\​​frac {n}{2}}}}.}

これらの正規化された中心モーメントは無次元量であり、スケールの線形変化とは無関係に分布を表します。

注目すべき瞬間

平均

最初の素モーメントは平均であり、通常は次のように表される。μE[X]{\displaystyle \mu \equiv \operatorname {E} [X].}

分散

第二中心モーメントは分散である。分散の正の平方根は標準偏差である。σE[×μ2]12{\displaystyle \sigma \equiv \left(\operatorname {E} \left[(x-\mu )^{2}\right]\right)^{\frac {1}{2}}.}

歪度

第三中心モーメントは、分布の偏り具合を表す尺度です。対称分布は、定義されていれば、第三中心モーメントはゼロになります。正規化された第三中心モーメントは歪度と呼ばれ、多くの場合γで表されます。左に歪んだ分布(分布の裾が左側で長い)は、歪度は負になります。右に歪んだ分布(分布の裾が右側で長い)は、歪度は正になります。

正規分布とあまり変わらない分布の場合、中央値はμγσ /6付近になり、最頻値はμγσ /2付近になります。

尖度

四次中心モーメントは、分布の裾の重さを表す尺度です。これは4乗の期待値であるため、定義されている場合は常に非負です。また、点分布を除き常に正です。正規分布の四次中心モーメントは3σ4です

尖度κ は 標準化された第4中心モーメントとして定義されます。(同様に、次のセクションと同様に、過剰尖度は第4キュムラントを第2キュムラントの2乗で割った値です。)[ 4 ] [ 5 ]分布の裾が重い場合、尖度は高くなります(軽尖型と呼ばれることもあります)。逆に、裾が軽い分布(例えば、一様分布などの有界分布)の尖度は低くなります(平尖型と呼ばれることもあります)。

尖度は無制限に正の値を取ることができますが、κはγ 2 + 1以上でなければなりません。この等式は2値分布の場合にのみ成立します。正規分布からそれほど離れていない非有界歪分布の場合、κはγ 22 γ 2の範囲のどこかになる傾向があります。

この不等式は、 T = ( Xμ )/ σを考えることで証明できます。これは平方根の期待値なので、任意のaに対して非負です。しかし、これはa の二次多項式でもあります。その判別式は非正でなければならず、これにより必要な関係が得られます。 E[T21つのT12]{\displaystyle \operatorname {E} \left[\left(T^{2}-aT-1\right)^{2}\right]}

より高い瞬間

高次モーメントは 4 次モーメントを超えるモーメントです。

分散、歪度、尖度と同様に、これらはデータの非線形結合を伴う高次統計量であり、さらなる形状パラメータの記述や推定に使用できます。モーメントが高くなるほど、推定が難しくなります。つまり、同様の品質の推定値を得るためには、より大きなサンプルが必要になります。これは、高次化によって過剰な自由度が消費されるためです。さらに、これらは解釈が微妙な場合があり、多くの場合、低次のモーメントで理解するのが最も容易です。物理学におけるジャークジャウンスの高次微分と比較してみてください。たとえば、4 次モーメント (尖度) が「分散への寄与における肩部と比較した裾部の相対的重要度」と解釈できるのと同様に (所定の分散量では、尖度が高いほど裾部が厚くなり、尖度が低いほど肩部が広くなります)、5 次モーメントは「歪度への寄与における中心 (モードと肩部) と比較した裾部の相対的重要度」を測るものとして解釈できます (所定の歪度では、5 次モーメントが高いほど裾部の歪度が高く、モードの歪度が小さいことに対応し、5 次モーメントが低いほど肩部の歪度が大きいことに対応します)。

複雑な瞬間

混合モーメントとは、複数の変数が関与するモーメントです。

この値は のモーメントと呼ばれます(モーメントは非整数 に対しても定義されています)。確率変数の結合分布のモーメントも同様に定義されます。任意の整数 に対して、数学的期待値は の混合モーメント(ただし)と呼ばれ、 はの中心混合モーメントと呼ばれます。混合モーメントは共分散と呼ばれ、確率変数間の依存関係の基本的な特性の1つです。 E[X]{\displaystyle E[X^{k}]}{\displaystyle k}{\displaystyle k}X1Xn{\displaystyle X_{1}...X_{n}}0{\displaystyle k_{i}\geq 0}E[X11Xnn]{\displaystyle E[{X_{1}}^{k_{1}}\cdots {X_{n}}^{k_{n}}]}{\displaystyle k}1++n{\displaystyle k=k_{1}+...+k_{n}}E[X1E[X1]1XnE[Xn]n]{\displaystyle E[(X_{1}-E[X_{1}])^{k_{1}}\cdots (X_{n}-E[X_{n}])^{k_{n}}]}{\displaystyle k}E[X1E[X1]X2E[X2]]{\displaystyle E[(X_{1}-E[X_{1}])(X_{2}-E[X_{2}])]}

例としては、共分散共歪度共尖度などが挙げられます。共分散は1つだけですが、共歪度と共尖度は複数存在します。

モーメントの性質

中心の変換

は二項係数である ため、 bの周りのモーメントはaの周りのモーメントから次のように計算できます。 ×bn×1つの+1つのbn0nn×1つの1つのbn{\displaystyle (xb)^{n}=(x-a+ab)^{n}=\sum _{i=0}^{n}{n \choose i}(xa)^{i}(ab)^{ni}}n{\textstyle {\binom {n}{i}}}E[×bn]0nnE[×1つの]1つのbn{\displaystyle E\left[(xb)^{n}\right]=\sum _{i=0}^{n}{n \choose i}E\left[(xa)^{i}\right](ab)^{ni}.}

関数の畳み込みのモーメント

畳み込みの素モーメントは次のように表されます 。 ここで、 は括弧内に示した関数の 番目のモーメントを表します。この恒等式は、モーメント生成関数の畳み込み定理と、積の微分における連鎖律の適用によって得られます。 htfグラムtfτグラムtτdτ{\textstyle h(t)=(f*g)(t)=\int _{-\infty }^{\infty }f(\tau )g(t-\tau )\,d\tau }μn[h]0nnμ[f]μn[グラム]{\displaystyle \mu _{n}[h]=\sum _{i=0}^{n}{n \choose i}\mu _{i}[f]\mu _{ni}[g]}μn[]{\displaystyle \mu _{n}[\,\cdot \,]}n{\displaystyle n}

キュムラント

最初の生モーメントと2番目と3番目の正規化されていない中心モーメントは、XYが独立した確率変数 である場合、メートル1X+はいメートル1X+メートル1はいヴァールX+はいヴァールX+ヴァールはいμ3X+はいμ3X+μ3はい{\displaystyle {\begin{aligned}m_{1}(X+Y)&=m_{1}(X)+m_{1}(Y)\\\operatorname {Var} (X+Y)&=\operatorname {Var} (X)+\operatorname {Var} (Y)\\\mu _{3}(X+Y)&=\mu _{3}(X)+\mu _{3}(Y)\end{aligned}}}

(これらは、独立性よりも弱い条件を満たす変数にも当てはまります。最初の条件は常に当てはまりますが、2 番目が当てはまる場合、変数は無相関であると呼ばれます)。

これらは最初の 3 つのキュムラントであり、すべてのキュムラントはこの加法性を共有しています。

サンプルの瞬間

すべてのkについて、母集団のk番目の生のモーメントは、母集団から抽出された サンプルX 1、...、X nに適用されたk番目の生のサンプル モーメント を使用して推定できます。1n1nX{\displaystyle {\frac {1}{n}}\sum _{i=1}^{n}X_{i}^{k}}

生の標本モーメントの期待値は、母集団のk番目の生のモーメント(もし存在するならば)が任意の標本サイズnに対してそのモーメントに等しいことが示せます。したがって、これは不偏推定値です。これは、標本平均を用いて計算することで自由度を消費する中心モーメントの状況とは対照的です。例えば、母分散(第2中心モーメント)の不偏推定値は次のように与えられます。 ここで、前の分母n は自由度n − 1に置き換えられ、 は標本平均を指します。この母集団モーメントの推定値は、調整されていない観測標本モーメントよりも 倍大きくなり、「調整標本分散」または単に「標本分散」と呼ばれることもあります。 1n11nXX¯2{\displaystyle {\frac {1}{n-1}}\sum _{i=1}^{n}\left(X_{i}-{\bar {X}}\right)^{2}}X¯{\displaystyle {\bar {X}}}nn1{\displaystyle {\tfrac {n}{n-1}},}

モーメントの問題

確率分布をそのモーメントの列から決定する問題は、モーメントの問題と呼ばれます。このような問題は、極限定理の研究に関連して、P・L・チェビシェフ (1874) [ 6 ]によって初めて議論されました。ランダム変数の確率分布をそのモーメントによって一意に定義するためには、たとえば、カルレマンの条件が満たされていれば十分です。 同様の結果は、ランダムベクトルのモーメントについても成り立ちます。モーメントの問題は、すべてのモーメントが有限であり、各整数 に対して が有限であるような、ある関数 fモーメントの列である列の特徴付けを求めます。すると、 をモーメントとして持つ分布関数に弱収束する列が存在します。モーメントが一意に決定する場合、列はに弱収束します。 X{\displaystyle X}αE[X]{\displaystyle \alpha _{k}=E\left[X^{k}\right]}11α21/2{\displaystyle \sum _{k=1}^{\infty }{\frac {1}{\alpha _{2k}^{1/2k}}}=\infty }μn:n=1,2,3,{\displaystyle {{\mu _{n}}':n=1,2,3,\dots }}αk(n){\displaystyle \alpha _{k}(n)}k1{\displaystyle k\geq 1}αk(n)αk,n,{\displaystyle \alpha _{k}(n)\rightarrow \alpha _{k},n\rightarrow \infty ,}αk{\displaystyle \alpha _{k}}μn{\displaystyle {\mu _{n}}'}μ{\displaystyle \mu }αk{\displaystyle \alpha _{k}}μ{\displaystyle \mu }μn{\displaystyle {\mu _{n}}'}μ{\displaystyle \mu }

部分的な瞬間

部分モーメントは「片側モーメント」と呼ばれることもあります。基準点rに対するn次の下側部分モーメントと上側部分モーメントは次のように表されます。 μn(r)=r(rx)nf(x)dx,{\displaystyle \mu _{n}^{-}(r)=\int _{-\infty }^{r}(r-x)^{n}\,f(x)\,\mathrm {d} x,}μn+(r)=r(xr)nf(x)dx.{\displaystyle \mu _{n}^{+}(r)=\int _{r}^{\infty }(x-r)^{n}\,f(x)\,\mathrm {d} x.}

積分関数が収束しない場合は、部分モーメントは存在しません。

部分モーメントは1/ n乗で正規化されます。上方ポテンシャル比は、 1次の上方部分モーメントと正規化された2次の下方部分モーメントの比として表すことができます。

計量空間における中心モーメント

( M , d )を計量空間とし、B ( M )をM上のボレルσ代数、つまりMd部分集合によって生成されるσ代数とします。(技術的な理由から、 M は計量dに関して可分な空間であると仮定するのも便利です。) 1 ≤ p ≤ ∞とします。

測定空間( M ,B( M ))上の測度μの与えられた点x 0Mの周りのp 中心モーメントは次のように定義される。 Md(x,x0)pdμ(x).{\displaystyle \int _{M}d\left(x,x_{0}\right)^{p}\,\mathrm {d} \mu (x).}

μのx 0に関するp次中心モーメントが、あるx 0Mに対して有限である場合、 μは有限のp次中心モーメントを持つと言われます。

この測度の用語は通常の方法でランダム変数にも適用されます。つまり、(Ω, Σ, P )が確率空間で、X  : Ω → Mがランダム変数である場合、x 0MについてのXp次中心モーメントは と定義され 、 x 0 についてのXp次中心モーメントがある x 0 ∈ M について有限である場合X有限のp中心モーメントを持ちます。 Md(x,x0)pd(X(P))(x)=Ωd(X(ω),x0)pdP(ω)=E[d(X,x0)p],{\displaystyle \int _{M}d\left(x,x_{0}\right)^{p}\,\mathrm {d} \left(X_{*}\left(\mathbf {P} \right)\right)(x)=\int _{\Omega }d\left(X(\omega ),x_{0}\right)^{p}\,\mathrm {d} \mathbf {P} (\omega )=\operatorname {\mathbf {E} } [d(X,x_{0})^{p}],}

参照

参考文献

  1. ^ジョージ・マッキー(1980年7月)「対称性の活用としての調和解析 - 歴史的概観」アメリカ数学会報、新シリーズ、3 (1):549。
  2. ^ Papoulis, A. (1984).確率、ランダム変数、および確率過程, 第2版. ニューヨーク:マグロウヒル. pp.  145– 149.
  3. ^ 「Raw Moment -- from Wolfram MathWorld」 . 2009年5月28日時点のオリジナルよりアーカイブ2009年6月24日閲覧。Math-worldでの生々しい瞬間
  4. ^ Casella, George ; Berger, Roger L. (2002).統計的推論(第2版). Pacific Grove: Duxbury. ISBN 0-534-24312-6
  5. ^ Ballanda, Kevin P.; MacGillivray, HL (1988). 「Kurtosis: A Critical Review」. The American Statistician . 42 (2). American Statistical Association: 111– 119. doi : 10.2307/2684482 . JSTOR 2684482 . 
  6. ^フェラー, W. (1957-1971).確率論とその応用入門. ニューヨーク: John Wiley & Sons. 419ページ.

さらに読む