ローカルバイナリパターン

コンピュータビジョンの記述子

ローカルバイナリパターン（LBP ）は、コンピュータビジョンにおける分類に使用される視覚記述子の一種です。LBPは、1990年に提案されたテクスチャスペクトルモデルの特殊なケースです。^[1]^[2] LBPは、1994年に初めて説明されました。^[3]^[4]それ以来、テクスチャ分類のための強力な特徴量であることがわかりました。さらに、LBPをHOG（方向勾配ヒストグラム）記述子と組み合わせると、一部のデータセットで検出性能が大幅に向上することが判明しました。^[5]背景差分の分野における元のLBPのいくつかの改善の比較は、2015年にSilvaらによって行われました。^[6] LBPのさまざまなバージョンの完全な調査は、Bouwmansらによって見つけることができます。^[7]

コンセプト

LBP 特徴ベクトルは、最も単純な形式では、次のように作成されます。

検査対象のウィンドウをセルに分割します (例: 各セルに 16x16 ピクセル)。
セル内の各ピクセルを、隣接する8つのピクセル（左上、左中、左下、右上など）と比較します。ピクセルを円に沿って、つまり時計回りまたは反時計回りにたどります。
中心ピクセルの値が隣接ピクセルの値より大きい場合は「0」を、そうでない場合は「1」を書き込みます。これは8桁の2進数を表します（通常は便宜上10進数に変換されます）。
セル全体にわたって、各「数字」（つまり、中心よりも小さいピクセルと大きいピクセルの組み合わせ）の出現頻度のヒストグラムを計算します。このヒストグラムは、256次元の特徴ベクトルとして表すことができます。
必要に応じてヒストグラムを正規化します。
すべてのセルのヒストグラムを連結（正規化）します。これにより、ウィンドウ全体の特徴ベクトルが得られます。

特徴ベクトルは、サポートベクターマシン、エクストリームラーニングマシン、またはその他の機械学習アルゴリズムを用いて処理され、画像を分類することができます。このような分類器は、顔認識やテクスチャ分析に利用できます。

元の演算子の有用な拡張として、いわゆる均一パターン^[8]があります。これを使用すると、特徴ベクトルの長さを短縮し、単純な回転不変記述子を実装できます。このアイデアは、テクスチャ画像において一部のバイナリパターンが他のパターンよりも頻繁に発生するという事実に基づいています。ローカルバイナリパターンは、バイナリパターンが最大で2つの0-1または1-0の遷移を含む場合、均一と呼ばれます。たとえば、00010000 (2つの遷移) は均一パターンですが、01010100 (6つの遷移) は均一ではありません。LBPヒストグラムの計算では、ヒストグラムはすべての均一パターンに対して個別のビンを持ち、すべての非均一パターンは単一のビンに割り当てられます。均一パターンを使用すると、単一セルの特徴ベクトルの長さは 256 から 59 に短縮されます。58 個の均一バイナリパターンは、整数 0、1、2、3、4、6、7、8、12、14、15、16、24、28、30、31、32、48、56、60、62、63、64、96、112、120、124、126、127、128、129、131、135、143、159、191、192、193、195、199、207、223、224、225、227、231、239 に対応します。 240、241、243、247、248、249、251、252、253、254、255。

拡張機能

過剰完全ローカルバイナリパターン（OCLBP）：^[9] OCLBPはLBPの変種であり、顔認証の全体的なパフォーマンスを向上させることが示されている。LBPとは異なり、OCLBPは隣接ブロックへのオーバーラップを採用している。正式には、OCLBPの構成はS：（a、b、v、h、p、r）と表される。画像は、vの垂直オーバーラップとhの水平オーバーラップを持つa×bブロックに分割され、次に均一なパターンLBP（u2、p、r）がすべてのブロックから抽出される。さらに、OCLBPはいくつかの異なる構成で構成される。たとえば、元の論文では、著者らは3つの構成を使用した：S：（10、10、12、12、8、1）、（14、14、12、12、8、2）、（18、18、12、12、8、3）。 3つの構成は、10×10、14×14、18×18の3つのブロックサイズと、垂直方向および水平方向のオーバーラップ率の半分を考慮しています。これらの構成を連結することで、150×80の画像に対して40877次元の特徴ベクトルが形成されます。
遷移ローカルバイナリパターン（tLBP）：^[10]遷移コード化LBPのバイナリ値は、中央のピクセルを除くすべてのピクセルについて、時計回り方向の隣接ピクセルの比較で構成されます。
方向コード化ローカルバイナリパターン (dLBP): dLBP は、中心のピクセルを通る 4 つの基本方向に沿った強度の変化を 2 ビットでエンコードします。
マルチブロック LBP: 画像は複数のブロックに分割され、各ブロックの LBP ヒストグラムが計算され、最終的なヒストグラムとして連結されます。
ボリュームローカルバイナリパターン(VLBP): ^[11] VLBPは、動的テクスチャを(X,Y,T)空間におけるボリュームの集合として扱います。ここで、XとYは空間座標、Tはフレームインデックスを表します。これにより、ピクセルの近傍が3次元空間で定義され、ボリュームテキストンをヒストグラムに抽出することができます。
RGB-LBP: この演算子は、RGB カラースペースの 3 つのチャネルすべてにわたって LBP を個別に計算し、その結果を連結することによって取得されます。

実装

CMV には、一般的な LBP 実装 ( Wayback Machineに 2014-11-28 にアーカイブ) と、 MATLABの LBP ヒストグラムに対する多くの追加拡張が含まれています。
Python mahotas は、LBP の実装を含むオープンソースのコンピュータービジョンパッケージです。
OpenCVの Cascade Classifiers はバージョン 2 以降で LBP をサポートしています。
C 言語のオープンソースコンピュータービジョンライブラリである VLFeat (MATLAB を含む複数の言語へのバインディング付き) には実装があります。
LBPLibraryは、背景差分問題向けに開発された11種類のローカルバイナリパターン（LBP）アルゴリズムのコレクションです。これらのアルゴリズムはOpenCVをベースにC++で実装されています。CMakeファイルが提供されており、Windows、Linux、Mac OS Xと互換性があります。ライブラリはOpenCV 2.4.10で正常にテストされています。
BGSLibraryには、動き検出用のオリジナルのLBP実装^[12]と、認識率と堅牢性が向上したマルコフランダムフィールド^[13]と組み合わせた新しいLBP演算子バリアントが含まれています。
オープンソースの C++ ライブラリ dlib: 実装。
scikit-imageはオープンソースのPythonライブラリです。LBP用のCベースのPython実装を提供します。

参照

局所的な三項パターン
Scholarpedia におけるローカルバイナリパターン (LBP) 手法
国勢調査変換

参考文献

^ DC. HeとL. Wang (1990)、「テクスチャ単位、テクスチャスペクトル、テクスチャ分析」、地球科学とリモートセンシング、IEEE Transactions on、vol. 28、pp. 509 - 512。
^ L. WangとDC. He (1990)、「テクスチャスペクトルを用いたテクスチャ分類」、パターン認識、Vol. 23、No. 8、pp. 905 - 910。
^ T. Ojala、M. Pietikäinen、およびD. Harwood (1994)、「分布のカルバック識別に基づく分類によるテクスチャ測定のパフォーマンス評価」、第12回IAPR国際パターン認識会議(ICPR 1994)の議事録、第1巻、582〜585ページ。
^ T. Ojala、M. Pietikäinen、D. Harwood (1996)、「特徴分布に基づく分類によるテクスチャ測定の比較研究」、パターン認識、第29巻、51-59頁。
^ 「部分的オクルージョン処理を備えたHOG-LBP人検出器」、Xiaoyu Wang、Tony X. Han、Shuicheng Yan、ICCV 2009
^ C. Silva、T. Bouwmans、C. Frelicot、「ビデオの背景モデリングと減算のための拡張中心対称ローカルバイナリパターン」、VISAPP 2015、ベルリン、ドイツ、2015年3月。
^ T. Bouwmans、C. Silva、C. Marghes、M. Zitouni、H. Bhaskar、C. Frelicot、「背景モデリングと前景検出における特徴の役割と重要性について」arXiv : 1611.09099
^ Barkan他「高速高次元ベクトル乗算顔認識」ICCV 2013年大会論文集
^ Barkan他「高速高次元ベクトル乗算顔認識」ICCV 2013年大会論文集
^ Trefný, Jirí, Jirí Matas.「高速物体検出のための拡張ローカルバイナリパターンセット」Computer Vision Winter Workshop Proceedings. Vol. 2010. 2010.
^ Zhao, Guoying, Matti Pietikainen. 「局所バイナリパターンを用いた動的テクスチャ認識と顔表情への応用」IEEE Transactions on Pattern Analysis and Machine Intelligence 29.6 (2007): 915-928.
^ M. Heikkilä、M. Pietikäinen、「背景をモデリングし、移動する物体を検出するためのテクスチャベースの方法」、IEEE Transactions on Pattern Analysis and Machine Intelligence、28(4):657-662、2006年。
^ C., Kertész: テクスチャベースの前景検出、International Journal of Signal Processing, Image Processing and Pattern Recognition (IJSIP)、Vol. 4、No. 4、2011 年。

[1] DC. HeとL. Wang (1990)、「テクスチャ単位、テクスチャスペクトル、テクスチャ分析」、地球科学とリモートセンシング、IEEE Transactions on、vol. 28、pp. 509 - 512。

[2] L. WangとDC. He (1990)、「テクスチャスペクトルを用いたテクスチャ分類」、パターン認識、Vol. 23、No. 8、pp. 905 - 910。

[3] T. Ojala、M. Pietikäinen、およびD. Harwood (1994)、「分布のカルバック識別に基づく分類によるテクスチャ測定のパフォーマンス評価」、第12回IAPR国際パターン認識会議(ICPR 1994)の議事録、第1巻、582〜585ページ。

[4] T. Ojala、M. Pietikäinen、D. Harwood (1996)、「特徴分布に基づく分類によるテクスチャ測定の比較研究」、パターン認識、第29巻、51-59頁。

[5] 「部分的オクルージョン処理を備えたHOG-LBP人検出器」、Xiaoyu Wang、Tony X. Han、Shuicheng Yan、ICCV 2009

[6] C. Silva、T. Bouwmans、C. Frelicot、「ビデオの背景モデリングと減算のための拡張中心対称ローカルバイナリパターン」、VISAPP 2015、ベルリン、ドイツ、2015年3月。

[7] T. Bouwmans、C. Silva、C. Marghes、M. Zitouni、H. Bhaskar、C. Frelicot、「背景モデリングと前景検出における特徴の役割と重要性について」arXiv : 1611.09099

[8] Barkan他「高速高次元ベクトル乗算顔認識」ICCV 2013年大会論文集

[9] Barkan他「高速高次元ベクトル乗算顔認識」ICCV 2013年大会論文集

[10] Trefný, Jirí, Jirí Matas.「高速物体検出のための拡張ローカルバイナリパターンセット」Computer Vision Winter Workshop Proceedings. Vol. 2010. 2010.

[11] Zhao, Guoying, Matti Pietikainen. 「局所バイナリパターンを用いた動的テクスチャ認識と顔表情への応用」IEEE Transactions on Pattern Analysis and Machine Intelligence 29.6 (2007): 915-928.

[12] M. Heikkilä、M. Pietikäinen、「背景をモデリングし、移動する物体を検出するためのテクスチャベースの方法」、IEEE Transactions on Pattern Analysis and Machine Intelligence、28(4):657-662、2006年。

[13] C., Kertész: テクスチャベースの前景検出、International Journal of Signal Processing, Image Processing and Pattern Recognition (IJSIP)、Vol. 4、No. 4、2011 年。