Geometric algorithms for signal processing
射影フィルタは、 確率解析 と 情報 幾何学、または統計への微分幾何学的アプローチ に基づく 一連の アルゴリズム であり、非線形状態空間システムの フィルタリング問題の近似解を見つけるために使用されます。 [1] [2] [3]
フィルタリング問題は、信号の部分的なノイズ観測から、ランダム動的システムの観測されていない信号を推定することです。目的は、ノイズによって摂動された観測の履歴を条件として、信号の確率分布を計算することです。この分布により、観測の履歴が与えられた場合に、信号のすべての統計量を計算できます。この分布に密度がある場合、その密度は クシュナー・ストラトノビッチ方程式またはザカイ方程式と呼ばれる 特定の確率偏微分方程式 (SPDE)を満たします。非線形フィルタの密度は、無限次元関数空間で発展することが知られています。 [4] [5]
有限次元の確率密度族、たとえば ガウス密度 、ガウス 混合 、 指数族 を選択して、無限次元フィルタ密度を近似することができます。射影フィルタの基本的な考え方は、選択された密度空間の幾何学的構造を使用して、最適フィルタの無限次元 SPDE を選択された有限次元族に射影し、有限次元族 の密度のパラメータに対する有限次元 確率微分方程式(SDE) を取得し、完全なフィルタの進化を近似することです。 [3]これを行うために、選択された有限次元族には、 情報幾何学 の場合と同様に 多様体 構造が備わっています。射影フィルタは、キュービック センサー問題の最適フィルタに対してテストされました。射影フィルタは 、拡張カルマン フィルタ などの標準的なアルゴリズムでは近似するのが難しい最適フィルタの二峰性密度を効果的に追跡できます 。 [2] [6]
射影フィルタは、実装が迅速で効率的に時間内に実行され、効率的に実装可能なパラメータの有限次元SDEを提供するため、インライン推定に最適です。 [2]
射影フィルタは柔軟性も備えており、より豊富な近似族を選択することで近似の精度を微調整でき、一部の指数族は射影フィルタリングアルゴリズムの補正ステップを正確にします。 [3] 一部の定式化は、ヒューリスティックベースの仮定密度フィルタ [3] または ガラーキン法 と一致します。 [6] 射影フィルタは、平均二乗最小化などの正確な基準に従って、SPDE係数のみの最適近似を超えて、完全な無限次元フィルタを最適な方法で近似することもできます。 [7] 射影フィルタは、 スウェーデン国防研究局 [1]によって研究されており、 ナビゲーション 、 海洋力学 、 量子光学 と 量子システム 、 ファイバー 径の推定、カオス 時系列 の推定、 変化点検出 など のさまざまな分野にうまく適用されています。 [8]
歴史と発展
「射影フィルタ」という用語は、1987 年に Bernard Hanzon によって初めて造られ、 [9] 関連理論と数値例は、 Damiano Brigo の 博士課程の 研究中に、Bernard Hanzon および Francois LeGland と共同で、完全に開発、拡張され、厳密なものとなりました。 [10] [2] [3]これらの研究は、 Hellinger 距離 と Fisher 情報量
における射影フィルタを扱い 、選択された指数族に無限次元 SPDE の最適フィルタを射影するために使用されました。指数族は、フィルタリング アルゴリズムの予測ステップが正確になるように選択できます。 [ 2 ]
代わりの射影計量である直接計量に基づく、異なるタイプの射影 フィルタ が Armstrong と Brigo (2016) によって導入されました。 [ 6] その後、Armstrong、Brigo、およびRossi Ferrucci (2021) [7] は、無限次元最適フィルタを近似する際に特定の最適性基準を満たす最適射影フィルタを導出しました。実際、Stratonovichベースの射影フィルタは、選択された多様体上のSPDE個別係数の近似を最適化しましたが、SPDE解全体を最適化しませんでした。これは、最適射影フィルタを導入することで対処されました。ここでの革新性は、フィルタ方程式のStratonovich計算版に頼るのではなく、伊藤計算を直接扱うことです。これは、 ジェット束 に基づく多様体上の伊藤確率微分方程式の幾何学、いわゆる多様体上の伊藤確率微分方程式の2ジェット解釈に関する研究に基づいています。 [11]
L
2
{\displaystyle L^{2}}
射影フィルタの導出
ここでは、さまざまな射影フィルタの導出について概説します。
Stratonovichベースの射影フィルタ
これは、ハンゾン[9] によって概説され 、ブリゴ、ハンゾン、ルグランド [10] [2]によって完全に開発されたヘリンガー/フィッシャー計量の初期フィルタと、アームストロングとブリゴ(2016) [6] による直接L2計量の射影フィルタの両方の導出です。
観測されないランダム信号は伊藤 確率微分方程式 によってモデル化されると仮定する 。
X
t
∈
R
m
{\displaystyle X_{t}\in \mathbb {R} ^{m}}
d
X
t
=
f
(
X
t
,
t
)
d
t
+
σ
(
X
t
,
t
)
d
W
t
{\displaystyle dX_{t}=f(X_{t},t)\,dt+\sigma (X_{t},t)\,dW_{t}}
ここで、 f と は 値を持ち、 は ブラウン運動 です 。結果が成り立つために必要なすべての正則性条件の妥当性が仮定され、詳細は参考文献に記載されています。関連するノイズの多い観測プロセス は次のようにモデル化されます
。
σ
d
W
{\displaystyle \sigma \,dW}
R
m
{\displaystyle \mathbb {R} ^{m}}
W
t
{\displaystyle W_{t}}
Y
t
∈
R
d
{\displaystyle Y_{t}\in \mathbb {R} ^{d}}
d
Y
t
=
b
(
X
t
,
t
)
d
t
+
d
V
t
{\displaystyle dY_{t}=b(X_{t},t)\,dt+dV_{t}}
ここで は 値 を持ち、 に依存しないブラウン運動です 。上で示唆したように、完全なフィルタは、 の 事前分布と 時刻 まで
の の履歴が与えられたときの の条件付き分布です 。この分布の密度が次のように非公式に記述される場合
b
{\displaystyle b}
R
d
{\displaystyle \mathbb {R} ^{d}}
V
t
{\displaystyle V_{t}}
W
t
{\displaystyle W_{t}}
X
t
{\displaystyle X_{t}}
X
0
{\displaystyle X_{0}}
Y
{\displaystyle Y}
t
{\displaystyle t}
p
t
(
x
)
d
x
=
P
r
o
b
{
X
t
∈
d
x
|
σ
(
Y
s
,
s
≤
t
)
}
{\displaystyle p_{t}(x)dx=Prob\{X_{t}\in dx|\sigma (Y_{s},s\leq t)\}}
は時刻 までの ノイズの多い観測の履歴によって生成されるシグマ場 であり 、適切な技術的条件下では、密度は Kushner-Stratonovich SPDE を満たします。
σ
(
Y
s
,
s
≤
t
)
{\displaystyle \sigma (Y_{s},s\leq t)}
Y
{\displaystyle Y}
t
{\displaystyle t}
p
t
{\displaystyle p_{t}}
d
p
t
=
L
t
∗
p
t
d
t
+
p
t
[
b
(
⋅
,
t
)
−
E
p
t
(
b
(
⋅
,
t
)
)
]
T
[
d
Y
t
−
E
p
t
(
b
(
⋅
,
t
)
)
d
t
]
{\displaystyle dp_{t}={\cal {L}}_{t}^{*}p_{t}\ dt+p_{t}[b(\cdot ,t)-E_{p_{t}}(b(\cdot ,t))]^{T}[dY_{t}-E_{p_{t}}(b(\cdot ,t))dt]}
は期待値であり
、
順方向拡散演算子 は
E
p
{\displaystyle E_{p}}
E
p
[
h
]
=
∫
h
(
x
)
p
(
x
)
d
x
,
{\displaystyle E_{p}[h]=\int h(x)p(x)dx,}
L
t
∗
{\displaystyle {\cal {L}}_{t}^{*}}
L
t
∗
p
=
−
∑
i
=
1
m
∂
∂
x
i
[
f
i
(
x
,
t
)
p
t
(
x
)
]
+
1
2
∑
i
,
j
=
1
m
∂
2
∂
x
i
∂
x
j
[
a
i
j
(
x
,
t
)
p
t
(
x
)
]
{\displaystyle {\cal {L}}_{t}^{*}p=-\sum _{i=1}^{m}{\frac {\partial }{\partial x_{i}}}[f_{i}(x,t)p_{t}(x)]+{\frac {1}{2}}\sum _{i,j=1}^{m}{\frac {\partial ^{2}}{\partial x_{i}\partial x_{j}}}[a_{ij}(x,t)p_{t}(x)]}
と は 転置を表します。射影フィルタの最初のバージョンを導出するには、 SPDE を Stratonovich 形式にする必要があります。次のように得られます。
a
=
σ
σ
T
{\displaystyle a=\sigma \sigma ^{T}}
T
{\displaystyle T}
p
t
{\displaystyle p_{t}}
d
p
t
=
L
t
∗
p
t
d
t
−
1
2
p
t
[
|
b
(
⋅
,
t
)
|
2
−
E
p
t
{
|
b
(
⋅
,
t
)
|
2
}
]
d
t
+
p
t
[
b
(
⋅
,
t
)
−
E
p
t
{
b
(
⋅
,
t
)
}
]
T
∘
d
Y
t
.
{\displaystyle dp_{t}={\cal {L}}_{t}^{\ast }\,p_{t}\,dt-{\frac {1}{2}}\,p_{t}\,[\vert b(\cdot ,t)\vert ^{2}-E_{p_{t}}\{\vert b(\cdot ,t)\vert ^{2}\}]\,dt+p_{t}\,[b(\cdot ,t)-E_{p_{t}}\{b(\cdot ,t)\}]^{T}\circ dY_{t}\ .}
連鎖律を通して、 の SPDE をすぐに導出できます 。表記を短縮するには、この最後の SPDE を次のように書き直すことができます。
d
p
t
{\displaystyle d{\sqrt {p_{t}}}}
d
p
=
F
(
p
)
d
t
+
G
T
(
p
)
∘
d
Y
,
{\displaystyle dp=F(p)\,dt+G^{T}(p)\circ dY\ ,}
ここで、演算子 と は 次のように定義されます
F
(
p
)
{\displaystyle F(p)}
G
T
(
p
)
{\displaystyle G^{T}(p)}
F
(
p
)
=
L
t
∗
p
−
1
2
p
[
|
b
(
⋅
,
t
)
|
2
−
E
p
{
|
b
(
⋅
,
t
)
|
2
}
]
,
{\displaystyle F(p)={\cal {L}}_{t}^{\ast }\,p\,-{\frac {1}{2}}\,p\,[\vert b(\cdot ,t)\vert ^{2}-E_{p}\{\vert b(\cdot ,t)\vert ^{2}\}],}
G
T
(
p
)
=
p
[
b
(
⋅
,
t
)
−
E
p
{
b
(
⋅
,
t
)
}
]
T
.
{\displaystyle G^{T}(p)=p\,[b(\cdot ,t)-E_{p}\{b(\cdot ,t)\}]^{T}.}
平方根版は
d
p
=
1
2
p
[
F
(
p
)
d
t
+
G
T
(
p
)
∘
d
Y
]
.
{\displaystyle d{\sqrt {p}}={\frac {1}{2{\sqrt {p}}}}[F(p)\,dt+G^{T}(p)\circ dY]\ .}
これらは、解が無限次元関数空間で発展するストラトノビッチSPDEです。例えば、 (直接計量 )
で発展する可能性があります。
p
t
{\displaystyle p_{t}}
L
2
{\displaystyle L^{2}}
d
2
{\displaystyle d_{2}}
d
2
(
p
1
,
p
2
)
=
‖
p
1
−
p
2
‖
,
p
1
,
2
∈
L
2
{\displaystyle d_{2}(p_{1},p_{2})=\Vert p_{1}-p_{2}\Vert \ ,\ \ p_{1,2}\in L^{2}}
または (ヘリンガー計量 )
で発展する可能性があります。
p
t
{\displaystyle {\sqrt {p_{t}}}}
L
2
{\displaystyle L^{2}}
d
H
{\displaystyle d_{H}}
d
H
(
p
1
,
p
2
)
=
‖
p
1
−
p
2
‖
,
p
1
,
2
∈
L
1
{\displaystyle d_{H}({\sqrt {p_{1}}},{\sqrt {p_{2}}})=\Vert {\sqrt {p_{1}}}-{\sqrt {p_{2}}}\Vert ,\ \ \ p_{1,2}\in L^{1}}
ここで、 はヒルベルト空間のノルムです 。いずれにせよ、 (または )は有限次元の密度族内では発展しません。
‖
⋅
‖
{\displaystyle \Vert \cdot \Vert }
L
2
{\displaystyle L^{2}}
p
t
{\displaystyle p_{t}}
p
t
{\displaystyle {\sqrt {p_{t}}}}
S
Θ
=
{
p
(
⋅
,
θ
)
,
θ
∈
Θ
⊂
R
n
}
(
o
r
S
Θ
1
/
2
=
{
p
(
⋅
,
θ
)
,
θ
∈
Θ
⊂
R
n
}
)
.
{\displaystyle S_{\Theta }=\{p(\cdot ,\theta ),\ \theta \in \Theta \subset \mathbb {R} ^{n}\}\ (or\ S_{\Theta }^{1/2}=\{{\sqrt {p(\cdot ,\theta )}},\ \theta \in \Theta \subset \mathbb {R} ^{n}\}).}
射影フィルタの考え方は、 有限次元密度(または)を介して (または ) を近似することです 。
p
t
(
x
)
{\displaystyle p_{t}(x)}
p
t
(
x
)
{\displaystyle {\sqrt {p_{t}(x)}}}
p
(
x
,
θ
t
)
{\displaystyle p(x,\theta _{t})}
p
(
x
,
θ
t
)
{\displaystyle {\sqrt {p(x,\theta _{t})}}}
フィルタSPDEがストラトノビッチ形式であるという事実は、次のことを可能にします。ストラトノビッチSPDEは連鎖律を満たし、 ベクトル 場として振る舞うため、方程式は ベクトル場 と ベクトル場によって特徴付けられます 。このバージョンの射影フィルタでは、2つのベクトル場を別々に扱うことで十分です。とを(直接計量)の密度の接空間 、またはそれらの平方根(ヘリンガー計量)の 接空間に射影することができます 。直接計量の場合は、次が得られます
F
{\displaystyle F}
G
{\displaystyle G}
d
t
{\displaystyle dt}
F
{\displaystyle F}
d
Y
t
{\displaystyle dY_{t}}
G
{\displaystyle G}
F
{\displaystyle F}
G
{\displaystyle G}
S
Θ
{\displaystyle S_{\Theta }}
d
p
(
⋅
,
θ
t
)
=
Π
p
(
⋅
,
θ
t
)
[
F
(
p
(
⋅
,
θ
t
)
)
]
d
t
+
Π
p
(
⋅
,
θ
t
)
[
G
T
(
p
(
⋅
,
θ
t
)
)
]
∘
d
Y
t
{\displaystyle dp(\cdot ,\theta _{t})=\Pi _{p(\cdot ,\theta _{t})}[F(p(\cdot ,\theta _{t}))]\,dt+\Pi _{p(\cdot ,\theta _{t})}[G^{T}(p(\cdot ,\theta _{t}))]\circ dY_{t}\ }
ここでは 多様体 の 点における接空間射影で あり、 のようなベクトルに適用される場合 、 の各成分を射影することによって成分ごとに作用すると仮定される 。この接空間の基底は
Π
p
(
⋅
,
θ
)
{\displaystyle \Pi _{p(\cdot ,\theta )}}
p
(
⋅
,
θ
)
{\displaystyle p(\cdot ,\theta )}
S
Θ
{\displaystyle S_{\Theta }}
G
T
{\displaystyle G^{T}}
G
T
{\displaystyle G^{T}}
{
∂
p
(
⋅
,
θ
)
∂
θ
1
,
⋯
,
∂
p
(
⋅
,
θ
)
∂
θ
n
}
,
{\displaystyle \left\{{\frac {\partial p(\cdot ,\theta )}{\partial \theta _{1}}},\cdots ,{\frac {\partial p(\cdot ,\theta )}{\partial \theta _{n}}}\right\},}
と の内積を表すことで 、計量を定義します。
L
2
{\displaystyle L^{2}}
⟨
⋅
,
⋅
⟩
{\displaystyle \langle \cdot ,\cdot \rangle }
γ
i
j
(
θ
)
=
⟨
∂
p
(
⋅
,
θ
)
∂
θ
i
,
∂
p
(
⋅
,
θ
)
∂
θ
j
⟩
=
∫
∂
p
(
x
,
θ
)
∂
θ
i
∂
p
(
x
,
θ
)
∂
θ
j
d
x
{\displaystyle \gamma _{ij}(\theta )=\left\langle {\frac {\partial {p(\cdot ,\theta )}}{\partial \theta _{i}}}\,,{\frac {\partial {p(\cdot ,\theta )}}{\partial \theta _{j}}}\right\rangle =\int {\frac {\partial p(x,\theta )}{\partial \theta _{i}}}\,{\frac {\partial p(x,\theta )}{\partial \theta _{j}}}\,dx}
そして、射影は
Π
p
(
⋅
,
θ
)
γ
[
v
]
=
∑
i
=
1
n
[
∑
j
=
1
n
γ
i
j
(
θ
)
⟨
v
,
∂
p
(
⋅
,
θ
)
∂
θ
j
⟩
]
∂
p
(
⋅
,
θ
)
∂
θ
i
{\displaystyle \Pi _{p(\cdot ,\theta )}^{\gamma }[v]=\sum _{i=1}^{n}\left[\sum _{j=1}^{n}\gamma ^{ij}(\theta )\;\left\langle v,\,{\frac {\partial {p(\cdot ,\theta )}}{\partial \theta _{j}}}\right\rangle \right]\;{\frac {\partial {p(\cdot ,\theta )}}{\partial \theta _{i}}}}
の逆数です 。 射影された方程式は
γ
i
j
{\displaystyle \gamma ^{ij}}
γ
i
j
{\displaystyle \gamma _{ij}}
d
p
(
⋅
,
θ
t
)
=
Π
p
(
⋅
,
θ
)
[
F
(
p
(
⋅
,
θ
t
)
)
]
d
t
+
Π
p
(
⋅
,
θ
)
[
G
T
(
p
(
⋅
,
θ
t
)
)
]
∘
d
Y
t
{\displaystyle dp(\cdot ,\theta _{t})=\Pi _{p(\cdot ,\theta )}[F(p(\cdot ,\theta _{t}))]dt+\Pi _{p(\cdot ,\theta )}[G^{T}(p(\cdot ,\theta _{t}))]\circ dY_{t}}
と書くことができます。
∑
i
=
1
n
∂
p
(
⋅
,
θ
t
)
θ
i
∘
d
θ
i
=
∑
i
=
1
n
[
∑
j
=
1
n
γ
i
j
(
θ
)
⟨
F
(
p
(
⋅
,
θ
t
)
)
,
∂
p
(
⋅
,
θ
)
∂
θ
j
⟩
]
∂
p
(
⋅
,
θ
)
∂
θ
i
d
t
+
∑
i
=
1
n
[
∑
j
=
1
n
γ
i
j
(
θ
)
⟨
G
T
(
p
(
⋅
,
θ
t
)
)
,
∂
p
(
⋅
,
θ
)
∂
θ
j
⟩
]
∂
p
(
⋅
,
θ
)
∂
θ
i
∘
d
Y
t
,
{\displaystyle \sum _{i=1}^{n}{\frac {\partial p(\cdot ,\theta _{t})}{\theta _{i}}}\circ d\theta _{i}=\sum _{i=1}^{n}\left[\sum _{j=1}^{n}\gamma ^{ij}(\theta )\;\left\langle F(p(\cdot ,\theta _{t})),\,{\frac {\partial {p(\cdot ,\theta )}}{\partial \theta _{j}}}\right\rangle \right]\;{\frac {\partial {p(\cdot ,\theta )}}{\partial \theta _{i}}}dt+\sum _{i=1}^{n}\left[\sum _{j=1}^{n}\gamma ^{ij}(\theta )\;\left\langle G^{T}(p(\cdot ,\theta _{t})),\,{\frac {\partial {p(\cdot ,\theta )}}{\partial \theta _{j}}}\right\rangle \right]\;{\frac {\partial {p(\cdot ,\theta )}}{\partial \theta _{i}}}\circ dY_{t},}
ここで、ストラトノビッチ計算が連鎖律に従うことが重要でした。上記の方程式から、最終的な射影フィルタSDEは
d
θ
i
=
[
∑
j
=
1
n
γ
i
j
(
θ
t
)
∫
F
(
p
(
x
,
θ
t
)
)
∂
p
(
x
,
θ
t
)
∂
θ
j
d
x
]
d
t
+
∑
k
=
1
d
[
∑
j
=
1
n
γ
i
j
(
θ
t
)
∫
G
k
(
p
(
x
,
θ
t
)
)
∂
p
(
x
,
θ
t
)
∂
θ
j
d
x
]
∘
d
Y
k
{\displaystyle d\theta _{i}=\left[\sum _{j=1}^{n}\gamma ^{ij}(\theta _{t})\;\int F(p(x,\theta _{t}))\;{\frac {\partial p(x,\theta _{t})}{\partial \theta _{j}}}dx\right]dt+\sum _{k=1}^{d}\;\left[\sum _{j=1}^{n}\gamma ^{ij}(\theta _{t})\;\int G_{k}(p(x,\theta _{t}))\;{\frac {\partial p(x,\theta _{t})}{\partial \theta _{j}}}\;dx\right]\circ dY_{k}}
初期条件が選択された の場合です 。
θ
0
{\displaystyle \theta _{0}}
演算子FとGの定義を代入することで、直接計量における完全に明示的な射影フィルタ方程式が得られます。
d
θ
i
(
t
)
=
[
∑
j
=
1
m
γ
i
j
(
θ
t
)
∫
L
t
∗
p
(
x
,
θ
t
)
∂
p
(
x
,
θ
t
)
∂
θ
j
d
x
−
∑
j
=
1
m
γ
i
j
(
θ
t
)
∫
1
2
[
|
b
(
x
,
t
)
|
2
−
∫
|
b
(
z
,
t
)
|
2
p
(
z
,
θ
t
)
d
z
]
p
(
x
,
θ
t
)
∂
p
(
x
,
θ
t
)
∂
θ
j
d
x
]
d
t
{\displaystyle d\theta _{i}(t)=\left[\sum _{j=1}^{m}\gamma ^{ij}(\theta _{t})\;\int {{\cal {L}}_{t}^{\ast }\,p(x,\theta _{t})}\;{\frac {\partial p(x,\theta _{t})}{\partial \theta _{j}}}dx-\sum _{j=1}^{m}\gamma ^{ij}(\theta _{t})\;\int {\frac {1}{2}}\left[\vert b(x,t)\vert ^{2}-\int \vert b(z,t)\vert ^{2}p(z,\theta _{t})dz\right]\;p(x,\theta _{t})\;{\frac {\partial p(x,\theta _{t})}{\partial \theta _{j}}}\;dx\right]dt}
+
∑
k
=
1
d
[
∑
j
=
1
m
γ
i
j
(
θ
t
)
∫
[
b
k
(
x
,
t
)
−
∫
b
k
(
z
,
t
)
p
(
z
,
θ
t
)
d
z
]
p
(
x
,
θ
t
)
∂
p
(
x
,
θ
t
)
∂
θ
j
d
x
]
∘
d
Y
t
k
.
{\displaystyle +\sum _{k=1}^{d}\;\left[\sum _{j=1}^{m}\gamma ^{ij}(\theta _{t})\;\int \left[b_{k}(x,t)-\int b_{k}(z,t)p(z,\theta _{t})dz\right]\;p(x,\theta _{t})\;{\frac {\partial p(x,\theta _{t})}{\partial \theta _{j}}}\;dx\right]\circ dY_{t}^{k}\ .}
代わりにヘリンガー距離を使用する場合は、密度の平方根が必要です。接空間基底は
{
∂
p
(
⋅
,
θ
)
∂
θ
1
,
⋯
,
∂
p
(
⋅
,
θ
)
∂
θ
n
}
,
{\displaystyle \left\{{\frac {\partial {\sqrt {p(\cdot ,\theta )}}}{\partial \theta _{1}}},\cdots ,{\frac {\partial {\sqrt {p(\cdot ,\theta )}}}{\partial \theta _{n}}}\right\},}
そして、計量を定義します。
1
4
g
i
j
(
θ
)
=
⟨
∂
p
∂
θ
i
,
∂
p
∂
θ
j
⟩
=
1
4
∫
1
p
(
x
,
θ
)
∂
p
(
x
,
θ
)
∂
θ
i
∂
p
(
x
,
θ
)
∂
θ
j
d
x
.
{\displaystyle {\frac {1}{4}}g_{ij}(\theta )=\left\langle {\frac {\partial {\sqrt {p}}}{\partial \theta _{i}}}\,,{\frac {\partial {\sqrt {p}}}{\partial \theta _{j}}}\right\rangle ={\frac {1}{4}}\int {\frac {1}{p(x,\theta )}}\,{\frac {\partial p(x,\theta )}{\partial \theta _{i}}}\,{\frac {\partial p(x,\theta )}{\partial \theta _{j}}}\,dx.}
計量は フィッシャー情報計量です。直接計量の場合と完全に類似した手順に従うと、ヘリンガー/フィッシャー計量におけるフィルタ方程式は
g
{\displaystyle g}
d
θ
i
=
[
∑
j
=
1
n
g
i
j
(
θ
t
)
∫
F
(
p
(
x
,
θ
t
)
)
p
(
x
,
θ
t
)
∂
p
(
x
,
θ
t
)
∂
θ
j
d
x
]
d
t
+
∑
k
=
1
d
[
∑
j
=
1
m
g
i
j
(
θ
t
)
∫
G
k
(
p
(
x
,
θ
t
)
)
p
(
x
,
θ
t
)
∂
p
(
x
,
θ
t
)
∂
θ
j
d
x
]
∘
d
Y
t
k
,
{\displaystyle d\theta _{i}=\left[\sum _{j=1}^{n}g^{ij}(\theta _{t})\;\int {\frac {F(p(x,\theta _{t}))}{p(x,\theta _{t})}}\;{\frac {\partial p(x,\theta _{t})}{\partial \theta _{j}}}\;dx\right]dt+\sum _{k=1}^{d}\;\left[\sum _{j=1}^{m}g^{ij}(\theta _{t})\;\int {\frac {G_{k}(p(x,\theta _{t}))}{p(x,\theta _{t})}}\;{\frac {\partial p(x,\theta _{t})}{\partial \theta _{j}}}\;dx\right]\circ dY_{t}^{k}\ ,}
初期条件が選択された の場合です 。
θ
0
{\displaystyle \theta _{0}}
FとGを代入すると、次のようになります
d
θ
i
(
t
)
=
[
∑
j
=
1
m
g
i
j
(
θ
t
)
∫
L
t
∗
p
(
x
,
θ
t
)
p
(
x
,
θ
t
)
∂
p
(
x
,
θ
t
)
∂
θ
j
d
x
−
∑
j
=
1
m
g
i
j
(
θ
t
)
∫
1
2
|
b
t
(
x
)
|
2
∂
p
(
x
,
θ
t
)
∂
θ
j
d
x
]
d
t
{\displaystyle d\theta _{i}(t)=\left[\sum _{j=1}^{m}g^{ij}(\theta _{t})\;\int {\frac {{\cal {L}}_{t}^{\ast }\,p(x,\theta _{t})}{p(x,\theta _{t})}}\;{\frac {\partial p(x,\theta _{t})}{\partial \theta _{j}}}\;dx-\sum _{j=1}^{m}g^{ij}(\theta _{t})\int {\frac {1}{2}}\vert b_{t}(x)\vert ^{2}{\frac {\partial p(x,\theta _{t})}{\partial \theta _{j}}}dx\right]dt}
+
∑
k
=
1
d
[
∑
j
=
1
m
g
i
j
(
θ
t
)
∫
b
k
(
x
,
t
)
∂
p
(
x
,
θ
t
)
∂
θ
j
d
x
]
∘
d
Y
t
k
.
{\displaystyle +\sum _{k=1}^{d}\;\left[\sum _{j=1}^{m}g^{ij}(\theta _{t})\;\int b_{k}(x,t)\;{\frac {\partial p(x,\theta _{t})}{\partial \theta _{j}}}\;dx\right]\circ dY_{t}^{k}\ .}
直接計量における射影フィルタは、混合族の多様体上に実装されると 、ガラーキン法と同等になる。 [6]
S
Θ
{\displaystyle S_{\Theta }}
ヘリンガー/フィッシャー計量における射影フィルタは、 指数関数型密度族の平方根の多様体上に実装された場合、仮定された密度フィルタと同等である。 [3]
S
Θ
1
/
2
{\displaystyle S_{\Theta }^{1/2}}
より単純なザカイ方程式を 、正規化されていない密度pに対して射影することも可能であることに注意すべきである 。これは、同じヘリンガー射影フィルタとなるが、異なる直接計量射影フィルタとなる。 [6]
最後に、指数関数型族の場合 、指数関数型族の十分統計量に、観測関数、すなわち の成分とを含めると 、フィルタリングアルゴリズムの補正ステップが正確になることがわかる。言い換えれば、ベクトル場の射影は 正確であり、結果としてそれ自身になる。連続状態 と離散時間観測の 設定でフィルタリングアルゴリズムを記述すると 、関連するベイズ式が近似を伴わないため、新しい観測ごとに補正ステップが正確であることがわかる。 [3]
d
Y
t
{\displaystyle dY_{t}}
b
(
x
)
{\displaystyle b(x)}
|
b
(
x
)
|
2
{\displaystyle |b(x)|^{2}}
G
{\displaystyle G}
G
{\displaystyle G}
X
{\displaystyle X}
Y
{\displaystyle Y}
イトーベクトル射影とイトージェット射影に基づく最適射影フィルタ
ストラトノビッチ計算形式での正確なフィルタSPDEを考えるのではなく、伊藤計算形式で考えます。
d
p
t
=
L
t
∗
p
t
d
t
+
p
t
[
b
(
⋅
,
t
)
−
E
p
t
(
b
(
⋅
,
t
)
)
]
T
[
d
Y
t
−
E
p
t
(
b
(
⋅
,
t
)
)
d
t
]
.
{\displaystyle dp_{t}={\cal {L}}_{t}^{*}p_{t}\ dt+p_{t}[b(\cdot ,t)-E_{p_{t}}(b(\cdot ,t))]^{T}[dY_{t}-E_{p_{t}}(b(\cdot ,t))dt].}
上記のストラトノビッチ射影フィルタでは、ベクトル場 とが 別々に射影されました。定義により、射影はと を 別々に最適近似しますが、これはフィルタSPDE解全体に対して最良の近似を提供することを意味するものではありません。実際、ストラトノビッチ射影は、2つの項 とを別々に作用するため、 例えば小さい に対する 正確な の近似として 解の最適性を保証するものではありません。 解に適用する
ノルムを探す必要があるかもしれません。そのノルムは
F
{\displaystyle F}
G
{\displaystyle G}
F
{\displaystyle F}
G
{\displaystyle G}
F
{\displaystyle F}
G
{\displaystyle G}
p
(
⋅
,
θ
0
+
δ
t
)
{\displaystyle p(\cdot ,\theta _{0+\delta t})}
p
0
+
δ
t
{\displaystyle p_{0+\delta t}}
δ
t
{\displaystyle \delta t}
‖
⋅
‖
{\displaystyle \|\cdot \|}
θ
0
+
δ
t
≈
argmin
θ
‖
p
0
+
δ
t
−
p
(
⋅
,
θ
)
‖
.
{\displaystyle \theta _{0+\delta t}\approx {\mbox{argmin}}_{\theta }\ \|p_{0+\delta t}-p(\cdot ,\theta )\|.}
イトーベクトル射影は次のように得られます。密度空間のノルム を選択しましょう。これは 、直接計量またはヘリンガー計量に関連付けられている可能性があります。
‖
⋅
‖
{\displaystyle \|\cdot \|}
平均二乗誤差の
テイラー展開 の項を最小化(ただしゼロにしない)することによって、イトー 方程式の近似における拡散項を選択します。
θ
t
{\displaystyle \theta _{t}}
δ
t
{\displaystyle \delta t}
E
t
[
‖
p
0
+
δ
t
−
p
(
⋅
,
θ
0
+
δ
t
)
‖
2
]
{\displaystyle E_{t}[\|p_{0+\delta t}-p(\cdot ,\theta _{0+\delta t})\|^{2}]}
、
近似イトー方程式において、同じ差の項 を最小化するドリフト項を見つけること。ここでは 、位数項は最小化されるがゼロにはならず、 収束には決して達せず、 収束のみが得られる。
(
δ
t
)
2
{\displaystyle (\delta t)^{2}}
δ
t
{\displaystyle \delta t}
(
δ
t
)
2
{\displaystyle (\delta t)^{2}}
δ
t
{\displaystyle \delta t}
イトーベクトル射影のさらなる利点は、 の
1次テイラー展開を最小化することです。
δ
t
{\displaystyle \delta t}
‖
E
[
p
0
+
δ
t
−
p
(
⋅
,
θ
0
+
δ
t
)
]
‖
.
{\displaystyle \|E[p_{0+\delta t}-p(\cdot ,\theta _{0+\delta t})]\|.}
収束ではなく収束を 達成するために 、イトージェット射影が導入されます。これは計量射影の概念に基づいています。
(
δ
t
)
2
{\displaystyle (\delta t)^{2}}
δ
t
{\displaystyle \delta t}
密度 (または )の多様体 (または )への計量射影は 、(または )上の( または)への 最も近い点です 。これをと表記します 。計量射影は、定義により、選択された計量に従って、 において近似するためにできる最良のもの です。したがって、その考え方は、計量射影に可能な限り近い射影フィルタを見つけることです。言い換えれば、基準を考慮します
p
∈
L
2
{\displaystyle p\in L^{2}}
p
∈
L
2
{\displaystyle {\sqrt {p}}\in L^{2}}
S
Θ
{\displaystyle S_{\Theta }}
S
Θ
1
/
2
{\displaystyle S_{\Theta }^{1/2}}
S
Θ
{\displaystyle S_{\Theta }}
S
Θ
1
/
2
{\displaystyle S_{\Theta }^{1/2}}
p
{\displaystyle p}
p
{\displaystyle {\sqrt {p}}}
π
(
p
)
{\displaystyle \pi (p)}
p
{\displaystyle p}
S
Θ
{\displaystyle S_{\Theta }}
θ
0
+
δ
t
≈
argmin
θ
‖
π
(
p
0
+
δ
t
)
−
p
(
⋅
,
θ
)
‖
.
{\displaystyle \theta _{0+\delta t}\approx {\mbox{argmin}}_{\theta }\ \|\pi (p_{0+\delta t})-p(\cdot ,\theta )\|.}
詳細な計算は長くて面倒ですが [7] 、結果として得られる近似は 収束を達成します。実際、イトージェット射影は次の最適性基準を達成します。それは 次数項をゼロにし、 と の間の 平均二乗距離のテイラー展開の次数項を最小化します 。
(
δ
t
)
2
{\displaystyle (\delta t)^{2}}
δ
t
{\displaystyle \delta t}
(
δ
t
)
2
{\displaystyle (\delta t)^{2}}
L
2
{\displaystyle L^{2}}
π
(
p
0
+
δ
t
)
{\displaystyle \pi (p_{0+\delta t})}
p
(
⋅
,
θ
0
+
δ
t
)
{\displaystyle p(\cdot ,\theta _{0+\delta t})}
イトーベクトルとイトージェット射影はどちらも、微小時間における正確なフィルタの進化を最もよく近似するパラメータについて 、観測値 によって駆動される最終的なSDEをもたらします 。 [7]
d
Y
{\displaystyle dY}
θ
t
{\displaystyle \theta _{t}}
応用
Jones と Soatto (2011) は視覚慣性航法 [12] におけるオンライン推定や地図作成、位置特定に使えるアルゴリズムとして投影フィルタを挙げており 、 また Azimi-Sadjadi と Krishnaprasad (2005) [13] はナビゲーションに投影フィルタのアルゴリズムを使用している。投影フィルタは Lermusiaux 2006 によって 海洋力学への応用も検討されている 。[14] Kutschireiter、Rast、および Drugowitsch (2022) [15] は連続時間循環フィルタリングの文脈で投影フィルタについて言及している。量子システムの応用については、例えば van Handel と Mabuchi (2005) [16] を参照。彼らは量子投影フィルタを 量子光学 に適用し、光共振器内の強く結合した 2 レベル原子の光位相双安定性の量子モデルを研究した。量子システムへのさらなる応用は Gao、Zhang、および Petersen (2019) で検討されている。 [17] Ma, Zhao, Chen, Chang (2015) は、危険位置推定の文脈で射影フィルタに言及しており、Vellekoop and Clark (2006) [18]は、 変化点検出 を扱うために射影フィルタ理論を一般化しています 。Harel, Meir and Opper (2015) [19] は、仮定密度形式の射影フィルタを最適点過程のフィルタリングに適用し、 ニューラルエンコーディング に応用しています。Broecker and Parlitz (2000) [20] は、カオス 時系列 におけるノイズ低減のための射影フィルタ法を研究しています 。Zhang, Wang, Wu and Xu (2014)
[21] は、メルトブロー不織布の繊維径の測定を扱う推定手法の一部として、ガウス射影フィルタを適用しています。
参照
参考文献
^ ab 「スウェーデン国防研究局科学報告書」 (PDF) foi.se。 2016年3月3日に オリジナル (PDF)から アーカイブ。
^ abcdef Brigo, Damiano 、Hanzon , Bernard、LeGland, Francois (1998).「非線形フィルタリングへの微分幾何学的アプローチ:射影フィルタ」 (PDF) IEEE Transactions on Automatic Control . 43 (2): 247– 252. doi :10.1109/9.661075
^ abcdefg Brigo, Damiano; Hanzon, Bernard; LeGland, Francois (1999). 「密度の指数多様体への射影による近似非線形フィルタリング」 Bernoulli . 5 (3): 407–430 . doi :10.2307/3318714. JSTOR 3318714.
^ Chaleyat-Maurel, Mireille and Dominique Michel (1984), 有限次元フィルタの非存在の結果. Stochastics, 第13巻, 第1+2号, 83–102ページ
^ M. Hazewinkel, SI Marcus, HJ Sussmann (1983). 立方体センサー問題の条件付き統計に対する有限次元フィルターの非存在性.Systems & Control Letters 3(6), 331-340ページ, https://doi.org/10.1016/0167-6911(83)90074-9
^ abcdef アームストロング、ジョン;ブリゴ、ダミアーノ (2016). 「L2直接計量における混合多様体への確率的偏微分方程式射影による非線形フィルタリング」 制御、信号、システムの数学 . 28 (1): 1– 33. arXiv : 1303.6236 . 書誌コード :2016MCSS...28....5A. doi :10.1007/s00498-015-0154-1
^ abcd Armstrong, John; Brigo, Damiano; Rossi Ferrucci, Emilio (2019). 「部分多様体上の{SDE}の最適近似:イトーベクトル射影とイトージェット射影」 ロンドン数学会報 . 119 (1): 176– 213. arXiv : 1610.03887 . doi :10.1112/plms.12226.
^ Armstrong, J., Brigo, D., Hanzon, B. (2023). 情報幾何学を用いた最適射影フィルタ. Info. Geo. (2023). https://doi.org/10.1007/s41884-023-00108-x
^ ab Bernard Hanzon (1987). 非線形フィルタリングを近似するための微分幾何学的アプローチ。CTJ Dodson編著『統計理論の幾何学化』、219~223ページ。ULMD出版、ランカスター大学
^ ab Brigo, D. (1996). 指数密度多様体への射影によるフィルタリング。アムステルダム自由大学博士論文
^ John Armstrong and Damiano Brigo (2018). ジェットとしての固有確率微分方程式.英国王立協会紀要 A - 数理物理学および工学科学,474(2210),28ページ.doi: 10.1098/rspa.2017.0559
^ Jones, Eagle S; Soatto, Massimo (2011). 「視覚慣性航法、マッピング、そして位置推定:スケーラブルなリアルタイム因果的アプローチ」. 国際ロボティクス研究ジャーナル . 30 (4): 407– 430. doi :10.1177/0278364910388963.
^ Azimi-Sadjadi, Babak; Krishnaprasad, PS (2005). 「近似非線形フィルタリングと航行におけるその応用」. Automatica . 41 (6): 945–956 . doi :10.1016/j.automatica.2004.12.013.
^ Lermusiaux, Pierre F. J (2006). 「学際的な海洋ダイナミクスのための不確実性の推定と予測」. Journal of Computational Physics . 217 (1): 176–199 . Bibcode :2006JCoPh.217..176L. doi :10.1016/j.jcp.2006.02.010
^ Kutschireiter, Anna; Rast, Luke; Drugowitsch, Jan (2022). 「観測状態増分による射影フィルタリングと連続時間循環フィルタリングへの応用」 IEEE Transactions on Signal Processing . 70 : 686–700 . arXiv : 2102.09650 . Bibcode : 2022ITSP...70..686K. doi : 10.1109/TSP.2022.3143471 . PMC 9634992. PMID 36338544
^ van Handel, Ramon; Mabuchi, Hideo (2005). 「共振器QEDにおける高度非線形モデルのための量子射影フィルター」. Journal of Optics B: Quantum and Semiclassical Optics . 7 (10): S226 – S236 . arXiv : quant-ph/0503222 . Bibcode :2005JOptB...7S.226V. doi :10.1088/1464-4266/7/10/005
^ Gao, Qing; Zhang, Guofeng; Petersen, Ian R (2019). 「開放量子系のための指数関数的量子射影フィルタ」. Automatica . 99 : 59–68 . arXiv : 1705.09114 . doi :10.1016/j.automatica.2018.10.014.
^ Vellekoop, MH; Clark, JMC (2006). 「変化点検出問題への非線形フィルタリングアプローチ:直接法と微分幾何学的手法」. SIAM Review . 48 (2): 329–356 . 書誌コード :2006SIAMR..48..329V. doi :10.1137/050647438
^ Harel, Yuval; Meir, Ron; Opper, Manfred ( 2015). 「最適点過程フィルタリングへの扱いやすい近似:ニューラルエンコーディングへの応用」. Advances in Neural Information Processing Systems . 28.
^ Broecker, Jochen; Parlitz, Ulrich (2000). 「カオス時系列のノイズ低減とフィルタリング」. Proc. NOLTA 2000.
^ Zhang, Xian Miao; Wu Wang, Rong; Xu, Bugau (2014). 「メルトブローン不織布における繊維径の自動測定」. Journal of Industrial Textiles . 43 (4): 593– 605. doi :10.1177/1528083712471696.