Mathematical theorem
ハマー スリー・クリフォードの定理は、 確率論 、 数理統計学 、 統計力学 における結果であり、 マルコフネットワーク ( マルコフ確率場とも呼ばれる)によって生成される事象として厳密に正の 確率分布 を表現できる 必要十分条件を与える 。これは 確率場に関する基本定理で ある。 [1]これは、厳密に正の 質量 または 密度を 持つ確率分布が無向グラフ G に関して マルコフ特性 の 1 つを満たすのは、それが ギブス確率場 である場合、つまりその密度がグラフのクリーク(または 完全なサブグラフ )上で因数分解できる場合のみであることを述べている 。
マルコフ確率場とギブス確率場の関係は、 統計力学 の文脈において、 ローランド・ドブルシン [2] と フランク・スピッツァー [3] によって提唱された。この定理は 、1971年に未発表論文で同値性を証明した ジョン・ハマーズリーとピーター・クリフォードにちなんで名付けられた。 [4] [5] 包含排他原理 を用いたより単純な証明は、 1973年に ジェフリー・グリメット [6] 、 プレストン [7] 、シャーマン [8] によって独立に示され、 1974年には ジュリアン・ベサグ によって更なる証明が行われた。 [9]
証明の概要
任意のギブスランダムフィールドがすべてのマルコフ特性を満たすことを示すための単純なマルコフネットワーク。
ギブス確率場があらゆるマルコフ性 を満たすことを示すのは容易です 。この事実の例として、以下をご覧ください。
右の図では、与えられたグラフ上のギブス確率場は の形をしています 。変数 と が 固定されている場合、大域的マルコフ性により、 は と の 間に障壁を形成するため、次が成り立ちます( 条件付き独立性 を 参照 ) 。
Pr
(
A
,
B
,
C
,
D
,
E
,
F
)
∝
f
1
(
A
,
B
,
D
)
f
2
(
A
,
C
,
D
)
f
3
(
C
,
D
,
F
)
f
4
(
C
,
E
,
F
)
{\displaystyle \Pr(A,B,C,D,E,F)\propto f_{1}(A,B,D)f_{2}(A,C,D)f_{3}(C,D,F)f_{4}(C,E,F)}
C
{\displaystyle C}
D
{\displaystyle D}
A
,
B
⊥
E
,
F
|
C
,
D
{\displaystyle A,B\perp E,F|C,D}
C
,
D
{\displaystyle C,D}
A
,
B
{\displaystyle A,B}
E
,
F
{\displaystyle E,F}
および が 定数で、 および です 。これは が成り立つことを意味します 。
C
{\displaystyle C}
D
{\displaystyle D}
Pr
(
A
,
B
,
E
,
F
|
C
=
c
,
D
=
d
)
∝
[
f
1
(
A
,
B
,
d
)
f
2
(
A
,
c
,
d
)
]
⋅
[
f
3
(
c
,
d
,
F
)
f
4
(
c
,
E
,
F
)
]
=
g
1
(
A
,
B
)
g
2
(
E
,
F
)
{\displaystyle \Pr(A,B,E,F|C=c,D=d)\propto [f_{1}(A,B,d)f_{2}(A,c,d)]\cdot [f_{3}(c,d,F)f_{4}(c,E,F)]=g_{1}(A,B)g_{2}(E,F)}
g
1
(
A
,
B
)
=
f
1
(
A
,
B
,
d
)
f
2
(
A
,
c
,
d
)
{\displaystyle g_{1}(A,B)=f_{1}(A,B,d)f_{2}(A,c,d)}
g
2
(
E
,
F
)
=
f
3
(
c
,
d
,
F
)
f
4
(
c
,
E
,
F
)
{\displaystyle g_{2}(E,F)=f_{3}(c,d,F)f_{4}(c,E,F)}
A
,
B
⊥
E
,
F
|
C
,
D
{\displaystyle A,B\perp E,F|C,D}
局所マルコフ性を満たすすべての正の確率分布がギブス確率場でもあることを証明するには、異なる因数分解を組み合わせる手段を提供する次の補題を証明する必要があります。
補題1は、この図に示すように因数分解を組み合わせる手段を提供します。この図では、集合間の重なりは無視されていることに注意してください。
補題1
で 検討中のすべての確率変数の集合を表し、および で 任意の変数集合を表すものとします。(ここで、任意の変数集合 が与えられている場合 、 は からの変数への任意の割り当ても表します 。)
U
{\displaystyle U}
Θ
,
Φ
1
,
Φ
2
,
…
,
Φ
n
⊆
U
{\displaystyle \Theta ,\Phi _{1},\Phi _{2},\dots ,\Phi _{n}\subseteq U}
Ψ
1
,
Ψ
2
,
…
,
Ψ
m
⊆
U
{\displaystyle \Psi _{1},\Psi _{2},\dots ,\Psi _{m}\subseteq U}
X
{\displaystyle X}
X
{\displaystyle X}
X
{\displaystyle X}
もし
Pr
(
U
)
=
f
(
Θ
)
∏
i
=
1
n
g
i
(
Φ
i
)
=
∏
j
=
1
m
h
j
(
Ψ
j
)
{\displaystyle \Pr(U)=f(\Theta )\prod _{i=1}^{n}g_{i}(\Phi _{i})=\prod _{j=1}^{m}h_{j}(\Psi _{j})}
関数 およびに対して、関数 およびが 存在し 、
f
,
g
1
,
g
2
,
…
g
n
{\displaystyle f,g_{1},g_{2},\dots g_{n}}
h
1
,
h
2
,
…
,
h
m
{\displaystyle h_{1},h_{2},\dots ,h_{m}}
h
1
′
,
h
2
′
,
…
,
h
m
′
{\displaystyle h'_{1},h'_{2},\dots ,h'_{m}}
g
1
′
,
g
2
′
,
…
,
g
n
′
{\displaystyle g'_{1},g'_{2},\dots ,g'_{n}}
Pr
(
U
)
=
(
∏
j
=
1
m
h
j
′
(
Θ
∩
Ψ
j
)
)
(
∏
i
=
1
n
g
i
′
(
Φ
i
)
)
{\displaystyle \Pr(U)={\bigg (}\prod _{j=1}^{m}h'_{j}(\Theta \cap \Psi _{j}){\bigg )}{\bigg (}\prod _{i=1}^{n}g'_{i}(\Phi _{i}){\bigg )}}
つまり、 は をさらに因数分解するためのテンプレートを提供します 。
∏
j
=
1
m
h
j
(
Ψ
j
)
{\displaystyle \prod _{j=1}^{m}h_{j}(\Psi _{j})}
f
(
Θ
)
{\displaystyle f(\Theta )}
補題1の証明
をさらに因数分解するためのテンプレートとして を用いるには 、 の外側にあるすべての変数を 固定する必要があります。そのために、 を の変数 ( に含まれない変数 )への任意の固定割り当てとします。任意の変数集合 に対して 、 を の変数 ( の変数のうち の 変数を除く)に限定した 割り当てとします 。
∏
j
=
1
m
h
j
(
Ψ
j
)
{\displaystyle \prod _{j=1}^{m}h_{j}(\Psi _{j})}
f
(
Θ
)
{\displaystyle f(\Theta )}
Θ
{\displaystyle \Theta }
θ
¯
{\displaystyle {\bar {\theta }}}
U
∖
Θ
{\displaystyle U\setminus \Theta }
Θ
{\displaystyle \Theta }
X
{\displaystyle X}
θ
¯
[
X
]
{\displaystyle {\bar {\theta }}[X]}
θ
¯
{\displaystyle {\bar {\theta }}}
X
∖
Θ
{\displaystyle X\setminus \Theta }
X
{\displaystyle X}
Θ
{\displaystyle \Theta }
さらに、 のみを因数分解するには、 の変数について 他の因数を意味のないものにする必要がある 。これを行うには、因数分解は
f
(
Θ
)
{\displaystyle f(\Theta )}
g
1
(
Φ
1
)
,
g
2
(
Φ
2
)
,
.
.
.
,
g
n
(
Φ
n
)
{\displaystyle g_{1}(\Phi _{1}),g_{2}(\Phi _{2}),...,g_{n}(\Phi _{n})}
Θ
{\displaystyle \Theta }
Pr
(
U
)
=
f
(
Θ
)
∏
i
=
1
n
g
i
(
Φ
i
)
{\displaystyle \Pr(U)=f(\Theta )\prod _{i=1}^{n}g_{i}(\Phi _{i})}
次のように再表現される。
Pr
(
U
)
=
(
f
(
Θ
)
∏
i
=
1
n
g
i
(
Φ
i
∩
Θ
,
θ
¯
[
Φ
i
]
)
)
(
∏
i
=
1
n
g
i
(
Φ
i
)
g
i
(
Φ
i
∩
Θ
,
θ
¯
[
Φ
i
]
)
)
{\displaystyle \Pr(U)={\bigg (}f(\Theta )\prod _{i=1}^{n}g_{i}(\Phi _{i}\cap \Theta ,{\bar {\theta }}[\Phi _{i}]){\bigg )}{\bigg (}\prod _{i=1}^{n}{\frac {g_{i}(\Phi _{i})}{g_{i}(\Phi _{i}\cap \Theta ,{\bar {\theta }}[\Phi _{i}])}}{\bigg )}}
各 について 、 の外側にあるすべての変数は によって 規定された値に固定されています 。
i
=
1
,
2
,
.
.
.
,
n
{\displaystyle i=1,2,...,n}
g
i
(
Φ
i
∩
Θ
,
θ
¯
[
Φ
i
]
)
{\displaystyle g_{i}(\Phi _{i}\cap \Theta ,{\bar {\theta }}[\Phi _{i}])}
g
i
(
Φ
i
)
{\displaystyle g_{i}(\Phi _{i})}
Θ
{\displaystyle \Theta }
θ
¯
{\displaystyle {\bar {\theta }}}
それぞれについて
と
する
と
f
′
(
Θ
)
=
f
(
Θ
)
∏
i
=
1
n
g
i
(
Φ
i
∩
Θ
,
θ
¯
[
Φ
i
]
)
{\displaystyle f'(\Theta )=f(\Theta )\prod _{i=1}^{n}g_{i}(\Phi _{i}\cap \Theta ,{\bar {\theta }}[\Phi _{i}])}
g
i
′
(
Φ
i
)
=
g
i
(
Φ
i
)
g
i
(
Φ
i
∩
Θ
,
θ
¯
[
Φ
i
]
)
{\displaystyle g'_{i}(\Phi _{i})={\frac {g_{i}(\Phi _{i})}{g_{i}(\Phi _{i}\cap \Theta ,{\bar {\theta }}[\Phi _{i}])}}}
i
=
1
,
2
,
…
,
n
{\displaystyle i=1,2,\dots ,n}
Pr
(
U
)
=
f
′
(
Θ
)
∏
i
=
1
n
g
i
′
(
Φ
i
)
=
∏
j
=
1
m
h
j
(
Ψ
j
)
{\displaystyle \Pr(U)=f'(\Theta )\prod _{i=1}^{n}g'_{i}(\Phi _{i})=\prod _{j=1}^{m}h_{j}(\Psi _{j})}
最も重要なことは、 に割り当てられた値 が によって規定された値と矛盾しない場合 、 にないすべての変数 が からの値に固定されると が「消える」ということです 。
g
i
′
(
Φ
i
)
=
g
i
(
Φ
i
)
g
i
(
Φ
i
∩
Θ
,
θ
¯
[
Φ
i
]
)
=
1
{\displaystyle g'_{i}(\Phi _{i})={\frac {g_{i}(\Phi _{i})}{g_{i}(\Phi _{i}\cap \Theta ,{\bar {\theta }}[\Phi _{i}])}}=1}
Φ
i
{\displaystyle \Phi _{i}}
θ
¯
{\displaystyle {\bar {\theta }}}
g
i
′
(
Φ
i
)
{\displaystyle g'_{i}(\Phi _{i})}
Θ
{\displaystyle \Theta }
θ
¯
{\displaystyle {\bar {\theta }}}
に含まれないすべての変数 をからの値に固定すると 、
Θ
{\displaystyle \Theta }
θ
¯
{\displaystyle {\bar {\theta }}}
Pr
(
Θ
,
θ
¯
)
=
f
′
(
Θ
)
∏
i
=
1
n
g
i
′
(
Φ
i
∩
Θ
,
θ
¯
[
Φ
i
]
)
=
∏
j
=
1
m
h
j
(
Ψ
j
∩
Θ
,
θ
¯
[
Ψ
j
]
)
{\displaystyle \Pr(\Theta ,{\bar {\theta }})=f'(\Theta )\prod _{i=1}^{n}g'_{i}(\Phi _{i}\cap \Theta ,{\bar {\theta }}[\Phi _{i}])=\prod _{j=1}^{m}h_{j}(\Psi _{j}\cap \Theta ,{\bar {\theta }}[\Psi _{j}])}
以来 、
g
i
′
(
Φ
i
∩
Θ
,
θ
¯
[
Φ
i
]
)
=
1
{\displaystyle g'_{i}(\Phi _{i}\cap \Theta ,{\bar {\theta }}[\Phi _{i}])=1}
f
′
(
Θ
)
=
∏
j
=
1
m
h
j
(
Ψ
j
∩
Θ
,
θ
¯
[
Ψ
j
]
)
{\displaystyle f'(\Theta )=\prod _{j=1}^{m}h_{j}(\Psi _{j}\cap \Theta ,{\bar {\theta }}[\Psi _{j}])}
貸し出すと
次のようになります:
h
j
′
(
Θ
∩
Ψ
j
)
=
h
j
(
Ψ
j
∩
Θ
,
θ
¯
[
Ψ
j
]
)
{\displaystyle h'_{j}(\Theta \cap \Psi _{j})=h_{j}(\Psi _{j}\cap \Theta ,{\bar {\theta }}[\Psi _{j}])}
f
′
(
Θ
)
=
∏
j
=
1
m
h
j
′
(
Θ
∩
Ψ
j
)
{\displaystyle f'(\Theta )=\prod _{j=1}^{m}h'_{j}(\Theta \cap \Psi _{j})}
最終的に次のようになります。
Pr
(
U
)
=
(
∏
j
=
1
m
h
j
′
(
Θ
∩
Ψ
j
)
)
(
∏
i
=
1
n
g
i
′
(
Φ
i
)
)
{\displaystyle \Pr(U)={\bigg (}\prod _{j=1}^{m}h'_{j}(\Theta \cap \Psi _{j}){\bigg )}{\bigg (}\prod _{i=1}^{n}g'_{i}(\Phi _{i}){\bigg )}}
頂点、 、 によって形成されるクリークは 、 、 、 の交差点です 。
x
1
{\displaystyle x_{1}}
x
2
{\displaystyle x_{2}}
x
3
{\displaystyle x_{3}}
{
x
1
}
∪
∂
x
1
{\displaystyle \{x_{1}\}\cup \partial x_{1}}
{
x
2
}
∪
∂
x
2
{\displaystyle \{x_{2}\}\cup \partial x_{2}}
{
x
3
}
∪
∂
x
3
{\displaystyle \{x_{3}\}\cup \partial x_{3}}
補題1は、 の2つの異なる因数分解を組み合わせる手段を提供する 。局所マルコフ性は、任意の確率変数 に対して、次を満たす因数 および が存在することを意味する 。
Pr
(
U
)
{\displaystyle \Pr(U)}
x
∈
U
{\displaystyle x\in U}
f
x
{\displaystyle f_{x}}
f
−
x
{\displaystyle f_{-x}}
Pr
(
U
)
=
f
x
(
x
,
∂
x
)
f
−
x
(
U
∖
{
x
}
)
{\displaystyle \Pr(U)=f_{x}(x,\partial x)f_{-x}(U\setminus \{x\})}
ノード の近傍は どこにあるか 。補題1を繰り返し適用すると、最終的には クリークポテンシャルの積に因数分解される(右の図を参照)。
∂
x
{\displaystyle \partial x}
x
{\displaystyle x}
Pr
(
U
)
{\displaystyle \Pr(U)}
証明の終わり
参照
注記
^ Lafferty, John D.; Mccallum, Andrew (2001). 「条件付きランダムフィールド:シーケンスデータのセグメント化とラベリングのための確率モデル」. 第18回国際機械学習会議 (ICML-2001) 論文集 . Morgan Kaufmann. ISBN 9781558607781 . 2014年 12月14日 閲覧。 ランダムフィールドの基本定理(Hammersley & Clifford 1971)による
^ Dobrushin, PL (1968)、 「条件付き確率とその規則性の条件による確率場の記述」 、 確率論とその応用 、 13 (2): 197– 224、 doi :10.1137/1113026
^ スピッツァー、フランク (1971)、「マルコフ確率場とギブスアンサンブル」、 アメリカ数学月刊誌 、 78 (2): 142-154 、 doi :10.2307/2317621、 JSTOR 2317621
^ Hammersley, JM; Clifford, P. (1971), 有限グラフと格子上のマルコフ場 (PDF)
^ Clifford, P. (1990)、「統計におけるマルコフ確率場」、Grimmett, GR; Welsh, DJA (編)、Disorder in Physical Systems: A Volume in Honour of John M. Hammersley、オックスフォード大学出版局、pp. 19– 32、 ISBN 978-0-19-853215-6 , MR 1064553 , 2009年5月4日 取得
^ Grimmett, GR (1973)、「ランダムフィールドに関する定理」、 ロンドン数学会誌 、 5 (1): 81– 84、 CiteSeerX 10.1.1.318.3375 、 doi :10.1112/blms/5.1.81、 MR 0329039
^ プレストン、CJ(1973)、「一般化ギブス状態とマルコフ確率場」、 応用確率の進歩 、 5 (2): 242-261 、 doi :10.2307/1426035、 JSTOR 1426035、 MR 0405645
^ シャーマン、S.(1973)、「マルコフ確率場とギブス確率場」、 イスラエル数学ジャーナル 、 14 (1): 92-103 、 doi :10.1007/BF02761538、 MR 0321185
^ Besag, J. (1974)、「空間相互作用と格子システムの統計分析」、 Journal of the Royal Statistical Society、シリーズB 、 36 (2): 192– 236、 JSTOR 2984812、 MR 0373208
さらに読む
グリメット、ジェフリー(2018)、「7.」、グラフ上の確率(第2版)、ケンブリッジ大学出版局、 ISBN 9781108438179
ランゲス、ヘルゲ、「ハマーズリー・クリフォード定理と現代統計学への影響」 (PDF) 、ノルウェー科学技術大学数学科学部