パーツベースのモデル

部分ベースモデルとは、画像検出アルゴリズムの広範なクラスを指します。画像上の様々な部分を個別に用いて、対象物体の存在の有無と位置を判定します。これらの手法の中でも特に普及しているのが星座モデルです。これは、少数の特徴とそれらの相対的な位置を検出することで、対象物体の存在の有無を判定する手法を指します。

これらのモデルは、FischlerとElschlager [1]による、少数のテンプレートマッチの相対位置を用いるという当初のアイデアに基づいて構築され、Peronaらの研究[2]によって複雑化が進んでいます 。これらのモデルについては、コンステレーションモデルのセクションで説明します。コンステレーションモデルの意味をより深く理解するために、例を挙げると分かりやすいでしょう。例えば、顔を検出したいとします。コンステレーションモデルは、口、鼻、目といった小さなパーツの検出器を用い、それらの相対位置に基づいて画像に顔があるかどうかを判断します。

非星座モデル

星座型モデルを除外した上でも、「パーツベースモデル」というタイトルの下には多くの重複するアイデアが含まれています。共通点は、小さなパーツを用いて、物体(顔、車など)を検出・認識できるアルゴリズムを構築することです。Yuille、Hallinan、Cohen [3]などの初期の取り組みでは、顔の特徴を検出し、それに変形可能なテンプレートを当てはめようとしました。これらのテンプレートは数学的に定義されたアウトラインであり、特徴の位置と形状を捉えることを目的としています。Yuille、Hallinan、Cohen のアルゴリズムは、与えられたモデルに対するグローバルな最小適合度を見つけるのが難しく、そのためテンプレートが不一致になることが時々ありました。

ポッジオとブルネッリ[4]などの後期の研究では、特徴ごとに特定の検出器を構築することに焦点を当てています。彼らは、連続する検出器を用いてスケールや位置などを推定し、次の検出器が使用する探索範囲を絞り込みます。これは部分ベースのモデルですが、顔の存在を検出するよりも、特定の顔を認識することに重点を置いています。彼らは、各検出器を用いて、特定の顔の特徴を表す35要素のベクトルを構築します。これらの特徴を比較することで特定の顔を認識しますが、カットオフを用いることで、顔が存在するかどうかも検出できます。[5]

Cootes、Lanitis、Taylor [6]はこの研究を基に、顔の主要な特徴を100要素で表現する手法を構築した。このモデルはより詳細かつ堅牢であるが、複雑さが増す(35要素から100要素に増加)ことを考えると、これは当然のことと言えるだろう。このモデルは基本的に、形状、向き、グレーレベルに関して平均的な顔からの偏差を計算する。このモデルは、誤差関数を最小化することでマッチングを行う。これらの3種類のアルゴリズムは、テンプレートマッチングの範疇に自然に含まれる[7]。

非星座のうち、おそらく最も成功しているのは、ライベとシーレのアルゴリズムです。[8] [9]彼らのアルゴリズムは、正の例に関連付けられたテンプレートを見つけ、テンプレート(存在するすべての正の例の特徴の平均)とテンプレートに対するアイテム(たとえば顔)の中心の位置の両方を記録します。次に、アルゴリズムはテスト画像を取得し、関心点ロケータ(できればスケール不変の種類の1つ)を実行します。次に、これらの関心点は各テンプレートと比較され、一致の確率が計算されます。次に、すべてのテンプレートは、一致の確率とテンプレートが中心を予測する確率に比例して、検出されたオブジェクトの中心に投票します。これらの投票はすべて合計され、十分な数があり、十分にクラスター化されている場合、問題のオブジェクト(つまり、顔または車)の存在が予測されます。

このアルゴリズムは、星座モデルのように星座の硬直性を大幅に低減するため効果的です。確かに星座モデルは遮蔽やその他の大きな異常を考慮に入れるために修正できますが、このモデルは当然それらに適しています。また、星座のより硬直的な構造が望ましい場合もあることを付け加えておきます。

参照

参考文献

  1. ^ Fischler, MA; Elschlager, RA (1973). 「絵画構造の表現とマッチング」. IEEE Transactions on Computers . C-22 : 67–92 . doi :10.1109/TC.1973.223602.
  2. ^ Fergus, R.; Perona, P.; Zisserman, A. (2003).教師なしスケール不変学習による物体クラス認識. IEEE Computer Society Conference on Computer Vision and Pattern Recognition. 第2巻. pp. II–264. doi :10.1109/CVPR.2003.1211479. ISBN 0-7695-1900-8
  3. ^ Yuille, Alan L.; Hallinan, Peter W.; Cohen, David S. (1992). 「変形可能なテンプレートを用いた顔からの特徴抽出」. International Journal of Computer Vision . 8 (2): 99. doi :10.1007/BF00127169.
  4. ^ Brunelli, R.; Poggio, T. (1993). 「顔認識:特徴とテンプレート」. IEEE Transactions on Pattern Analysis and Machine Intelligence . 15 (10): 1042. doi :10.1109/34.254061.
  5. ^ Simonite, Tom. 「写真アルゴリズムは白人男性を識別できるが、黒人女性はそうではない」Wired . ISSN  1059-1028 . 2023年4月17日閲覧
  6. ^ Lanitis, A.; Taylor, CJ; Cootes, TF (1995).顔画像の符号化と解釈への統一的なアプローチ. IEEE International Conference on Computer Vision. p. 368. doi :10.1109/ICCV.1995.466919. hdl : 20.500.14279/29314 . ISBN 0-8186-7042-8
  7. ^ Brunelli, R. (2009). コンピュータビジョンにおけるテンプレートマッチング技術:理論と実践. Wiley. ISBN 978-0-470-51706-2
  8. ^ Leibe, Bastian; Leonardis, Aleš; Schiele, Bernt (2007). 「インターリーブされた分類とセグメンテーションによる堅牢な物体検出」International Journal of Computer Vision . 77 ( 1– 3): 259– 289. CiteSeerX 10.1.1.111.464 . doi :10.1007/s11263-007-0095-3. 
  9. ^ Leibe, Bastian; Leonardis, Ales; Schiele, Bernt (2006). 「物体の分類と分割を組み合わせた暗黙の形状モデル」.カテゴリーレベルの物体認識に向けて. コンピュータサイエンス講義ノート. 第4170巻. p. 508. CiteSeerX 10.1.1.5.6272 . doi :10.1007/11957959_26. ISBN  978-3-540-68794-8
「https://en.wikipedia.org/w/index.php?title=パーツベースモデル&oldid=1293501302」より取得