マーサーの定理

Mathematical theorem

数学、特に関数解析学においてマーサーの定理は、正方形上の対称正定値関数を積関数の収束列の和として表現するものである。(Mercer 1909)で提示されたこの定理は、ジェームズ・マーサー(1883–1932)の研究における最も注目すべき成果の一つである。積分方程式論における重要な理論的ツールであり、確率過程のヒルベルト空間理論、例えばカルーネン・レーヴの定理において用いられる。また、再生核ヒルベルト空間理論においても用いられ、対称正定値核を再生核として特徴付ける。 [1]

導入

マーサーの定理を説明するために、まず重要な特殊なケースを考えます。より一般的な定式化については以下を参照してください。この文脈におけるとは、対称連続関数 です。

K : [ a , b ] × [ a , b ] R {\displaystyle K:[a,b]\times [a,b]\rightarrow \mathbb {R} }

すべての場合において K ( x , y ) = K ( y , x ) {\displaystyle K(x,y)=K(y,x)} x , y [ a , b ] {\displaystyle x,y\in [a,b]}

Kが正定値核であるとは、

i = 1 n j = 1 n K ( x i , x j ) c i c j 0 {\displaystyle \sum _{i=1}^{n}\sum _{j=1}^{n}K(x_{i},x_{j})c_{i}c_{j}\geq 0}

[ ab ] の点x 1 , ...,  x nの有限列と実数c 1 , ...,  c nの任意の選択に対して成り立つ。定義には弱い不等式が含まれているにもかかわらず、「正定値」という用語は文献で広く使用されていることに注意されたい。[2] [3]

定常正定値核(ただし )の基本的な特徴付けは、ボクナーの定理によって与えられる。これは、連続関数が正定値関数であるためには、有限の非負測度 のフーリエ変換として表すことができる必要があることを述べている。 K ( x , y ) = K ( x y ) {\displaystyle K(x,y)=K(x-y)} K ( x y ) {\displaystyle K(x-y)} μ {\displaystyle \mu }

K ( x y ) = e i ( x y ) ω d μ ( ω ) {\displaystyle K(x-y)=\int _{-\infty }^{\infty }e^{i(x-y)\omega }\,d\mu (\omega )}

このスペクトル表現は、正定値性と調和解析の関係を明らかにし、カーネルが定常である場合、例えば、点のペアの位置の 2 変数関数ではなく、点間の距離の 1 変数関数として表現できる場合、不等式による抽象的な定義よりも、正定値のより強力で直接的な特徴付けを提供します。

Kには、積分によって定義される関数上 の線型作用素(より具体的には、区間がコンパクトである場合のヒルベルト・シュミット積分作用素)が関連付けられている。

[ T K φ ] ( x ) = a b K ( x , s ) φ ( s ) d s . {\displaystyle [T_{K}\varphi ](x)=\int _{a}^{b}K(x,s)\varphi (s)\,ds.}

実数値二乗可積分関数L 2 [ ab ] の空間をとおして分布すると仮定するが、多くの場合、関連する再生核ヒルベルト空間はL 2 [ ab ]よりも厳密に大きくなる可能性がある。T Kは線型作用素であるため、T K固有値固有関数が存在する。 φ {\displaystyle \varphi }

定理. Kが連続対称正定値核であるとする。すると、L 2 [ ab ]直交基底 { e i } iが存在し、これはT Kの固有関数から成り、対応する固有値列 {λ i } iは非負である。非零の固有値に対応する固有関数は [ ab ] 上で連続であり、K は次のように表現される。

K ( s , t ) = j = 1 λ j e j ( s ) e j ( t ) {\displaystyle K(s,t)=\sum _{j=1}^{\infty }\lambda _{j}\,e_{j}(s)\,e_{j}(t)}

ここで収束は絶対的かつ均一です。

詳細

ここでは、マーサーの定理の証明の構造、特にそれがコンパクト演算子のスペクトル理論とどのように関係するかについて、より詳しく説明します。

  • 写像KT Kは単射である
  • T KはL 2 [ a , b ]上の非負対称コンパクト演算子である。さらにK ( x , x ) ≥ 0 である。

コンパクト性を示すには、 TKの下でのL 2 [ a , b ]単位球の像が等連続であることを示しアスコリ定理を適用して単位球の像がC([ a , b ])において比較的コンパクトでありL 2 [ a , b ]においてさらにコンパクトであることを示します。

ここで、ヒルベルト空間上のコンパクト作用素のスペクトル定理をT Kに適用して、 L 2 [ a , b ] の 直交基底{ e i } iの存在を示す。

λ i e i ( t ) = [ T K e i ] ( t ) = a b K ( t , s ) e i ( s ) d s . {\displaystyle \lambda _{i}e_{i}(t)=[T_{K}e_{i}](t)=\int _{a}^{b}K(t,s)e_{i}(s)\,ds.}

λ i ≠ 0 の場合、固有ベクトル(固有関数e iは [ a , b ]上で連続であることがわかる。ここで

i = 1 λ i | e i ( t ) e i ( s ) | sup x [ a , b ] | K ( x , x ) | , {\displaystyle \sum _{i=1}^{\infty }\lambda _{i}|e_{i}(t)e_{i}(s)|\leq \sup _{x\in [a,b]}|K(x,x)|,}

これは、シーケンスが

i = 1 λ i e i ( t ) e i ( s ) {\displaystyle \sum _{i=1}^{\infty }\lambda _{i}e_{i}(t)e_{i}(s)}

は絶対かつ一様収束して核K 0に収束し、これは核Kと同じ作用素を定義することが容易に分かる。したがってK = K 0となり、マーサーの定理が導かれる。

最後に、固有値が非負であることを示すために、 と書き、 右辺をそのリーマン和でよく近似された積分として表すことができます。リーマン和は、Kの正定値性により非負となり、 、 を意味します λ f , f = f , T K f {\displaystyle \lambda \langle f,f\rangle =\langle f,T_{K}f\rangle } λ f , f 0 {\displaystyle \lambda \langle f,f\rangle \geq 0} λ 0 {\displaystyle \lambda \geq 0}

トレース

すぐに次のようになります。

定理. Kが連続対称正定値核であるとする。T K は非負の固有値の列 {λ i } iを持つ。すると

a b K ( t , t ) d t = i λ i . {\displaystyle \int _{a}^{b}K(t,t)\,dt=\sum _{i}\lambda _{i}.}

これは、演算子T Kトレースクラス演算子で あり、

trace ( T K ) = a b K ( t , t ) d t . {\displaystyle \operatorname {trace} (T_{K})=\int _{a}^{b}K(t,t)\,dt.}

一般化

マーサーの定理自体は、任意の対称 半正定値行列はベクトル集合の グラミアン行列であるという結果の一般化です。

最初の一般化では、区間 [ ab ] を任意のコンパクトハウスドルフ空間に置き換え、 [ ab ] 上のルベーグ測度を、台がXであるXボレル代数上の有限可算加法測度 μ に置き換える。これは、 Xの任意の空でない開部分集合Uに対して μ( U ) > 0が成立することを意味する

最近の一般化では、これらの条件を次のように置き換えている。集合Xはボレル(完全)測度 μ を持つ第一可算位相空間である。Xμ の台であり、Xの任意のxに対して、 xを含み有限測度を持つ開集合Uが存在する。この場合、本質的に同じ結果が成り立つ。

定理。K が X 上の連続対称正定値核であるとする関数κL 1 μ ( X ) であり、Xのすべてのxに対して κ(x) := K(x,x)であるとき、T Kの固有関数からなるL 2 μ ( X )直交集合 { e i } iが存在し、その固有値列 {λ i } iは非負である。非零の固有値に対応する固有関数はX上で連続であり、K は次のように表現される 。

K ( s , t ) = j = 1 λ j e j ( s ) e j ( t ) {\displaystyle K(s,t)=\sum _{j=1}^{\infty }\lambda _{j}\,e_{j}(s)\,e_{j}(t)}

ここで、収束はXのコンパクト部分集合上で絶対かつ均一である。

次の一般化では、測定可能なカーネルの表現を扱います。

( X , M , μ ) を σ 有限測度空間とする。X上のL 2(または平方可積分)核は関数である。

K L μ μ 2 ( X × X ) . {\displaystyle K\in L_{\mu \otimes \mu }^{2}(X\times X).}

L 2核は、次の式で 有界演算子T Kを定義する。

T K φ , ψ = X × X K ( y , x ) φ ( y ) ψ ( x ) d [ μ μ ] ( y , x ) . {\displaystyle \langle T_{K}\varphi ,\psi \rangle =\int _{X\times X}K(y,x)\varphi (y)\psi (x)\,d[\mu \otimes \mu ](y,x).}

T Kはコンパクト作用素です(実際にはヒルベルト・シュミット作用素でもあります)。核Kが対称であれば、スペクトル定理より、T Kは固有ベクトルの直交基底を持ちます。非零の固有値に対応する固有ベクトルは、(分離可能性に関わらず){ e i } i の列に並べることができます

定理。Kが( XM、μ) 上の対称正定値核であるとき、

K ( y , x ) = i N λ i e i ( y ) e i ( x ) {\displaystyle K(y,x)=\sum _{i\in \mathbb {N} }\lambda _{i}e_{i}(y)e_{i}(x)}

ここで、 L 2ノルムの収束です 。カーネルの連続性が仮定されていない場合、展開は一様収束しなくなることに注意してください。

マーサーの状態

数値関数K ( x , y ) がマーサーの条件を満たすとは、すべての平方積分可能な関数g ( x ) に対して

g ( x ) K ( x , y ) g ( y ) d x d y 0. {\displaystyle \iint g(x)K(x,y)g(y)\,dx\,dy\geq 0.}

ディスクリートアナログ

これは半正定値行列の定義に類似している。これは次元の行列であり、すべてのベクトルに対して以下の性質 を満たす。 K {\displaystyle K} N {\displaystyle N} g {\displaystyle g}

( g , K g ) = g T K g = i = 1 N j = 1 N g i K i j g j 0 {\displaystyle (g,Kg)=g^{T}{\cdot }Kg=\sum _{i=1}^{N}\sum _{j=1}^{N}\,g_{i}\,K_{ij}\,g_{j}\geq 0}

正の定数関数

K ( x , y ) = c {\displaystyle K(x,y)=c\,}

マーサーの条件を満たすので、積分はフビニの定理により次のようになる。

g ( x ) c g ( y ) d x d y = c g ( x ) d x g ( y ) d y = c ( g ( x ) d x ) 2 {\displaystyle \iint g(x)\,c\,g(y)\,dx\,dy=c\int \!g(x)\,dx\int \!g(y)\,dy=c\left(\int \!g(x)\,dx\right)^{2}}

これは確かに非負です。

参照

注記

  1. ^ バートレット、ピーター (2008). 「再現カーネルヒルベルト空間」(PDF) . CS281B/Stat241B 統計学習理論講義ノート. カリフォルニア大学バークレー校.
  2. ^ Mohri, Mehryar (2018).機械学習の基礎. Afshin Rostamizadeh, Ameet Talwalkar (第2版). マサチューセッツ州ケンブリッジ. ISBN 978-0-262-03940-6. OCLC  1041560990.{{cite book}}: CS1 maint: location missing publisher (link)
  3. ^ Berlinet, A. (2004).確率統計における核ヒルベルト空間の再現. Christine Thomas-Agnan. ニューヨーク: Springer Science+Business Media. ISBN 1-4419-9096-8. OCLC  844346520。

参考文献

  • Adriaan Zaanen、線形解析、North Holland Publishing Co.、1960 年、
  • Ferreira, JC, Menegatto, VA,滑らかな正定値核によって定義される積分作用素の固有値, 積分方程式と作用素理論, 64 (2009), no. 1, 61–81. (計量空間に対するマーサーの定理の一般化を与える。この結果は第一可算位相空間にも容易に適用できる。)
  • Konrad Jörgens線形積分演算子、ピットマン、ボストン、1982 年、
  • リチャード・クーラントデイヴィッド・ヒルベルト「数理物理学の方法」第1巻、インターサイエンス1953年、
  • ロバート・アッシュ『情報理論』ドーバー出版、1990年
  • マーサー, J. (1909)「正負型関数と積分方程式理論との関連」王立協会哲学論文集 A209 ( 441–458 ): 415–446Bibcode :1909RSPTA.209..415M、doi : 10.1098/rsta.1909.0016
  • 「マーサーの定理」数学百科事典EMSプレス、2001 [1994]
  • H. König、「コンパクト演算子の固有値分布」、Birkhäuser Verlag、1986 年。(有限測度 μ に対するマーサーの定理の一般化を示します。)
Retrieved from "https://en.wikipedia.org/w/index.php?title=Mercer%27s_theorem&oldid=1314618280#Mercer's_condition"