イメージの瞬間

画像処理コンピューター ビジョン、および関連分野において、画像モーメントとは、画像ピクセルの強度の特定の加重平均(モーメント)、またはそのようなモーメントの関数であり、通常は何らかの魅力的な特性や解釈を持つように選択されます。

画像モーメントは、セグメンテーション後の物体を記述するのに役立ちます。画像モーメントによって得られる画像の単純な特性には、面積(または総強度)、重心、および方向に関する情報などがあります。

生々しい瞬間

2次元連続関数f ( x , y )に対して、次数( p + q )のモーメント(「生モーメント」と呼ばれることもある)は次のように定義される。

Mpq×pyqf×yd×dy{\displaystyle M_{pq}=\int \limits _{-\infty }^{\infty }\int \limits _{-\infty }^{\infty }x^{p}y^{q}f(x,y)\,dx\,dy}

p , q = 0,1,2,... これをピクセル強度I ( x , y )を持つスカラー(グレースケール)画像に適用すると、生の画像モーメントM ijは次のように計算されます

Mj×y×yj×y{\displaystyle M_{ij}=\sum _{x}\sum _{y}x^{i}y^{j}I(x,y)\,\!}

場合によっては、画像を確率密度関数として考えることによって計算される。つまり、上記の値を

×y×y{\displaystyle \sum _{x}\sum _{y}I(x,y)\,\!}

一意性定理[ 1 ]によれば、f ( x , y )が区分的に連続で、 xy平面の有限部分においてのみ非零値をとる場合 、あらゆる次数のモーメントが存在し、モーメント列( Mpq )はf ( x , y )によって一意に決定される。[ 2 ]逆に、( Mpq )はf(x,y)を一意に決定する実際このはいくつかの低次のモーメントの関数で要約される。

生のモーメント から得られる単純な画像プロパティは次のとおりです。

  • 面積(バイナリ画像の場合)またはグレーレベルの合計(グレートーン画像の場合):M00{\displaystyle M_{00}}
  • 重心:{ׯ y¯}{M10M00M01M00}{\displaystyle \{{\bar {x}},\ {\bar {y}}\}=\left\{{\frac {M_{10}}{M_{00}}},{\frac {M_{01}}{M_{00}}}\right\}}

中心的な瞬間

中心モーメントは次のように定義される。

μpq×ׯpyy¯qf×yd×dy{\displaystyle \mu_{pq}=\int\limits_{-\infty}^{\infty}\int\limits_{-\infty}^{\infty}(x-{\bar{x}})^{p}(y-{\bar{y}})^{q}f(x,y)\,dx\,dy}

ここで、 およびは重心の成分です。 ׯM10M00{\displaystyle {\bar {x}}={\frac {M_{10}}{M_{00}}}}y¯M01M00{\displaystyle {\bar {y}}={\frac {M_{01}}{M_{00}}}}

ƒ ( xy ) がデジタル画像の 場合、前の式は次のようになります。

μpq×y×ׯpyy¯qf×y{\displaystyle \mu _{pq}=\sum _{x}\sum _{y}(x-{\bar {x}})^{p}(y-{\bar {y}})^{q}f(x,y)}

3 次までの中心モーメントは次のとおりです。

μ00M00μ010μ100μ11M11ׯM01M11y¯M10μ20M20ׯM10μ02M02y¯M01μ21M212ׯM11y¯M20+2ׯ2M01μ12M122y¯M11ׯM02+2y¯2M10μ30M303ׯM20+2ׯ2M10μ03M033y¯M02+2y¯2M01{\displaystyle {\begin{aligned}\mu _{00}&=M_{00},&\mu _{01}&=0,\\\mu _{10}&=0,&\mu _{11}&=M_{11}-{\bar {x}}M_{01}=M_{11}-{\bar {y}}M_{10},\\\mu _{20}&=M_{20}-{\bar {x}}M_{10},&\mu _{02}&=M_{02}-{\bar {y}}M_{01},\\\mu _{21}&=M_{21}-2{\bar {x}}M_{11}-{\bar {y}}M_{20}+2{\bar {x}}^{2}M_{01},&\mu _{12}&=M_{12}-2{\bar {y}}M_{11}-{\bar {x}}M_{02}+2{\bar {y}}^{2}M_{10},\\\mu _{30}&=M_{30}-3{\bar {x}}M_{20}+2{\bar {x}}^{2}M_{10},&\mu _{03}&=M_{03}-3{\bar {y}}M_{02}+2{\bar {y}}^{2}M_{01}.\end{aligned}}}

次のことが証明されます:

μpqメートルpnqpメートルqnׯpメートルy¯qnMメートルn{\displaystyle \mu_{pq}=\sum_{m}^{p}\sum_{n}^{q}{p \choose m}{q \choose n}(-{\bar{x}})^{(pm)}(-{\bar{y}})^{(qn)}M_{mn}}

中心モーメントは並進不変です。

画像の向きに関する情報は、まず 2 次中心モーメントを使用して共分散行列を構築することによって導き出すことができます。

μ20μ20/μ00M20/M00ׯ2μ02μ02/μ00M02/M00y¯2μ11μ11/μ00M11/M00ׯy¯{\displaystyle {\begin{aligned}\mu '_{20}&=\mu _{20}/\mu _{00}=M_{20}/M_{00}-{\bar {x}}^{2}\\\mu '_{02}&=\mu _{02}/\mu _{00}=M_{02}/M_{00}-{\bar {y}}^{2}\\\mu '_{11}&=\mu _{11}/\mu _{00}=M_{11}/M_{00}-{\bar {x}}{\bar {y}}\end{aligned}}}

画像の共分散行列×y{\displaystyle I(x,y)}

カバー[×y][μ20μ11μ11μ02]{\displaystyle \operatorname {cov} [I(x,y)]={\begin{bmatrix}\mu '_{20}&\mu '_{11}\\\mu '_{11}&\mu '_{02}\end{bmatrix}}。}

この行列の固有ベクトル画像強度の長軸と短軸に対応するため、最大の固有値に対応する固有ベクトルの、この固有ベクトルに最も近い軸に対する角度から方向を抽出できます。この角度Θは次の式で表されます。

Θ12アークタンジェント2μ11μ20μ02{\displaystyle \Theta ={\frac {1}{2}}\arctan \left({\frac {2\mu '_{11}}{\mu '_{20}-\mu '_{02}}}\right)}

上記の式は、以下の条件が満たされる限り有効です。

μ20μ020{\displaystyle \mu '_{20}-\mu '_{02}\neq 0}

共分散行列の固有値次のように簡単に示せる。

λμ20+μ022±4μ112+μ20μ0222{\displaystyle \lambda _{i}={\frac {\mu '_{20}+\mu '_{02}}{2}}\pm {\frac {\sqrt {4{\mu '}_{11}^{2}+({\mu '}_{20}-{\mu '}_{02})^{2}}}{2}},}

は固有ベクトル軸の長さの2乗に比例します。したがって、固有値の大きさの相対的な差は、像の離心率、つまり像がどれだけ長く伸びているかを示します。離心率

1λ2λ1.{\displaystyle {\sqrt {1-{\frac {\lambda _{2}}{\lambda _{1}}}}}.}

モーメント不変量

モーメントは、特定の変換クラスに関する 不変量を導出するために使用できるため、画像解析での応用でよく知られています。

この文脈では、不変モーメントという用語がしばしば誤用されます。しかし、モーメント不変量はモーメントから形成される不変量ですが、それ自体が不変量となるモーメントは中心モーメントだけです。

以下に詳述する不変量は、連続領域においてのみ厳密に不変であることに注意してください。離散領域では、拡大縮小も回転も明確に定義されません。このように変換された離散画像は一般に近似値であり、変換は可逆ではありません。したがって、これらの不変量は、離散画像内の形状を記述する場合にのみ近似的に不変となります。

翻訳不変量

任意の次数の中心モーメントμ i jは、構造上、並進に対して不変です。

スケール不変量

平行移動スケールの両方に関する不変量η i j は、適切にスケールされたゼロ次中心モーメントで割ることによって中心モーメントから構築できます。

ηij=μijμ00(1+i+j2){\displaystyle \eta _{ij}={\frac {\mu _{ij}}{\mu _{00}^{\left(1+{\frac {i+j}{2}}\right)}}}\,\!}

ここで、i + j ≥ 2です。中心モーメントのみを使用することで、並進不変性が直接得られることに注意してください。

回転不変量

Huの研究[ 3 ] [ 4 ]に示されているように、並進スケール回転 に関する不変量は次のように構築できます。

I1=η20+η02{\displaystyle I_{1}=\eta _{20}+\eta _{02}}

I2=(η20η02)2+4η112{\displaystyle I_{2}=(\eta _{20}-\eta _{02})^{2}+4\eta _{11}^{2}}

I3=(η303η12)2+(3η21η03)2{\displaystyle I_{3}=(\eta _{30}-3\eta _{12})^{2}+(3\eta _{21}-\eta _{03})^{2}}

I4=(η30+η12)2+(η21+η03)2{\displaystyle I_{4}=(\eta _{30}+\eta _{12})^{2}+(\eta _{21}+\eta _{03})^{2}}

I5=(η303η12)(η30+η12)[(η30+η12)23(η21+η03)2]+(3η21η03)(η21+η03)[3(η30+η12)2(η21+η03)2]{\displaystyle I_{5}=(\eta _{30}-3\eta _{12})(\eta _{30}+\eta _{12})[(\eta _{30}+\eta _{12})^{2}-3(\eta _{21}+\eta _{03})^{2}]+(3\eta _{21}-\eta _{03})(\eta _{21}+\eta _{03})[3(\eta _{30}+\eta _{12})^{2}-(\eta _{21}+\eta _{03})^{2}]}

I6=(η20η02)[(η30+η12)2(η21+η03)2]+4η11(η30+η12)(η21+η03){\displaystyle I_{6}=(\eta _{20}-\eta _{02})[(\eta _{30}+\eta _{12})^{2}-(\eta _{21}+\eta _{03})^{2}]+4\eta _{11}(\eta _{30}+\eta _{12})(\eta _{21}+\eta _{03})}

I7=(3η21η03)(η30+η12)[(η30+η12)23(η21+η03)2](η303η12)(η21+η03)[3(η30+η12)2(η21+η03)2].{\displaystyle I_{7}=(3\eta _{21}-\eta _{03})(\eta _{30}+\eta _{12})[(\eta _{30}+\eta _{12})^{2}-3(\eta _{21}+\eta _{03})^{2}]-(\eta _{30}-3\eta _{12})(\eta _{21}+\eta _{03})[3(\eta _{30}+\eta _{12})^{2}-(\eta _{21}+\eta _{03})^{2}].}

これらはHu モーメント不変量としてよく知られています。

最初の項I 1は、画像の重心周りの 慣性モーメントに相当し、ピクセルの強度は物理的な密度に相当します。最初の6つの項I 1I 6は鏡映対称であり、つまり画像が鏡像になっても変化しません。最後の項I 7は鏡映反対称(鏡像になると符号が変わる)であり、これにより、鏡像であるにもかかわらず同一である画像を区別することができます。

回転モーメント不変量の完全かつ独立した集合を導くための一般理論は、J. Flusser によって提唱された。[ 5 ]彼は、従来の Hu モーメント不変量の集合は独立でも完全でもないことを示した。I 3 はの不変量に​​依存しているため、あまり有用ではない ( )。元の Hu 集合には、3次の独立したモーメント不変量が欠けている。 I3=(I52+I72)/I43{\displaystyle I_{3}=(I_{5}^{2}+I_{7}^{2})/I_{4}^{3}}

I8=η11[(η30+η12)2(η03+η21)2](η20η02)(η30+η12)(η03+η21){\displaystyle I_{8}=\eta _{11}[(\eta _{30}+\eta _{12})^{2}-(\eta _{03}+\eta _{21})^{2}]-(\eta _{20}-\eta _{02})(\eta _{30}+\eta _{12})(\eta _{03}+\eta _{21})}

I 7と同様に、I 8も反射反対称です。

その後、J.FlusserとT.Suk [ 6 ]は、N回転対称形状の場合の理論を専門化した。

アプリケーション

Zhangらは、Huモーメント不変量を適用して病的脳検出(PBD)問題を解決しました。[ 7 ] DoerrとFlorenceは、2次中心モーメントに関連する物体の向きの情報を使用して、マイクロX線断層撮影画像データから並進および回転不変の物体断面を効果的に抽出しました。[ 8 ]

DA HoeltzelとWei-Hua Chiengは、Huモーメント不変量を使用して、次元パラメータ化された4バーメカニズムを実行し、生成された合計356個のカップラー曲線から15の異なるカップラー曲線グループ(パターン)を生成しました。[ 9 ]

参考文献

  1. ^ Hu, Ming-Kuei (1962). 「モーメント不変量による視覚パターン認識」IRE Transactions on Information Theory . 8 (2): 179– 187. doi : 10.1109/TIT.1962.1057692 . ISSN  2168-2712 .
  2. ^ゴンザレス, ラファエル C.; ウッズ, リチャード E. (2001).デジタル画像処理. プレンティス・ホール. p. 672. ISBN 0-201-18075-8
  3. ^ MK Hu, 「モーメント不変量による視覚パターン認識」, IRE Trans. Info. Theory, vol. IT-8, pp.179–187, 1962
  4. ^ http://docs.opencv.org/modules/imgproc/doc/structural_analysis_and_shape_descriptors.html?highlight=cvmatchshapes#humoments Hu Moments の OpenCV メソッド
  5. ^ J. Flusser:「回転モーメント不変量の独立性について」、パターン認識、第33巻、1405〜1410頁、2000年。
  6. ^ J. FlusserとT. Suk、「対称物体の認識のための回転モーメント不変量」、IEEE Trans. Image Proc.、vol. 15、pp. 3784–3790、2006年。
  7. ^ Zhang, Y. (2015). 「ウェーブレットエントロピーとHuモーメント不変量に基づく病的脳検出」 .バイオメディカルマテリアルズアンドエンジニアリング. 26 : 1283–1290 . doi : 10.3233/BME-151426 . PMID 26405888 . 
  8. ^ Doerr, Frederik; Florence, Alastair (2020). 「多粒子カプセル製剤の特性評価のためのマイクロXRT画像解析と機械学習手法」 . International Journal of Pharmaceutics: X . 2 100041. doi : 10.1016/j.ijpx.2020.100041 . PMC 6997304. PMID 32025658 .  
  9. ^ Hoeltzel, DA; Chieng, Wei-Hua (1990). 「パターンマッチング合成によるメカニズム設計の自動化アプローチ」 . Journal of Mechanical Design . 112 (2): 190-199. doi : 10.1115/1.2912592 .