二項分類

物事を2つのカテゴリに分ける

二項分類とは、物事を2つのカテゴリ（それぞれクラスと呼ばれます）のいずれかに分類する作業です。したがって、これは任意の数のクラスに分類するという一般的な作業の最も単純な形です。典型的な二項分類問題には以下が含まれます

患者が特定の病気にかかっているかどうかを判断するための医学的検査。
業界における品質管理、仕様が満たされているかどうかを判断します。
情報検索において、ページが検索結果セットに含まれるべきかどうかを決定すること
行政においては、運転免許証を発行するかどうかを決定する
認知においては、物体が食べ物であるか否かを判断します。

二値分類器の精度を測定する最も簡単な方法は、エラー数を数えることです。しかし、現実世界では、2つのクラスのうちどちらか一方がより重要である場合が多いため、異なる種類のエラーの両方の数に注目することになります。例えば、医療検査では、病気が存在しないのに病気を検出すること（偽陽性）と、病気が存在するのに病気を検出しないこと（偽陰性）は、異なる意味合いで捉えられます。

このテスト済みインスタンスセットでは、仕切りの左側のインスタンスはテスト対象の条件を満たし、右側のインスタンスは満たしていません。楕円は、テストアルゴリズムによって条件を満たしていると分類されたインスタンスを囲んでいます。緑色の領域は、テストアルゴリズムによって正しく分類されたインスタンスを示しています。ラベルは、
TP = 真陽性、TN = 真陰性、FP = 偽陽性（タイプ I の誤り）、FN = 偽陰性（タイプ II の誤り）、TPR = 真陽性率を決定するためのインスタンスセット、FPR = 偽陽性率を決定するためのインスタンスセット、PPV = 陽性予測値、NPV = 陰性予測値を示しています。

4つの結果

特定のデータセットの分類を考えると、実際のデータカテゴリと割り当てられたカテゴリの4つの基本的な組み合わせがあります。真陽性TP（正しい陽性割り当て）、真陰性TN（正しい陰性割り当て）、偽陽性FP（誤った陽性割り当て）、および偽陰性FN（誤った陰性割り当て）。

割り当て実際	検査結果陽性	検査結果陰性
陽性条件	真陽性	偽陰性
状態陰性	偽陽性	真陰性

これらは 2×2 の分割表に整理することができ、行は実際の値（状態が陽性か状態が陰性か）に対応し、列は分類値（テスト結果が陽性かテスト結果が陰性か）に対応します。

評価

4つの基本的な結果の集計から、分類器または予測器の精度を測定するために使用できるアプローチは数多くあります。分野によって優先順位が異なります

8つの基本比率

評価の一般的なアプローチは、まず標準パターンの2つの比率を計算することです。分割表から計算できるこの形式の基本的な比率は8つあり、それぞれ合計が1になる4つの補数ペアで表されます。これらの比率は、4つの数値をそれぞれその行または列の合計で割ることで得られ、8つの数値が得られます。これらの数値は一般的に「真陽性行比率」または「偽陰性列比率」と呼ばれます。

したがって、列比のペアが 2 つあり、行比のペアが 2 つあります。各ペアから 1 つの比率を選択して、これらを 4 つの数値でまとめることができます。残りの 4 つの数値は補数です。

行の比率は次のとおりです。

真陽性率（TPR）= (TP/(TP+FN))、別名感度または再現率。これは、検査が正しいと判断される 条件を持つ集団の割合です。
- 補数を用いると、偽陰性率（FNR）＝（FN/（TP+FN））となる。
真陰性率（TNR）=（TN/（TN+FP）、別名特異度（SPC）、
- 補体偽陽性率（FPR）＝（FP/（TN+FP））であり、有病率とは無関係とも呼ばれる。

列の比率は次のとおりです。

陽性予測値（PPV、別名適合率）（TP/(TP+FP)）。これは、特定の検査結果を持つ集団のうち、その検査が正しいと判断される集団の割合です。
- 補数として偽発見率（FDR）（FP/(TP+FP)）
陰性予測値（NPV）（TN/(TN+FN)）
- 補数は偽脱落率（FOR）（FN/(TN+FN)）であり、有病率依存性とも呼ばれます。

診断検査において、主に用いられる比率は真の列比率（真陽性率と真陰性率）であり、これらは感度と特異度と呼ばれます。情報検索において、主に用いられる比率は真陽性比率（行と列）であり、これらは陽性予測値と真陽性率であり、これらは精度と再現率と呼ばれます。

カラン・ボーンは、どの指標の組み合わせをいつ使用すべきかを決定するためのフローチャートを提案している^[1] 。そうでなければ、決定するための一般的なルールは存在しない。また、ある分類器を他の分類器よりも優先すべき場合など、具体的な問題を決定するために、指標の組み合わせをどのように使用すべきかについても、一般的な合意は存在しない。

相補的な比率のペアの比をとることで、4つの尤度比（列の比率2つと行の比率2つ）が得られます。これは主に列（状態）比に対して行われ、診断検査における尤度比が得られます。これらの比率群のいずれかの比をとることで、最終的な比、すなわち診断オッズ比（DOR）が得られます。これは、(TP×TN)/(FP×FN) = (TP/FN)/(FP/TN)と直接定義することもできます。これはオッズ比として有用な解釈が可能であり、有病率に依存しません。

その他の指標

他にも多くの指標がありますが、最も単純なのは、すべてのインスタンスのうち正しく分類されたインスタンスの割合を測定する正確度またはFraction Correction (FC)です。その補完指標はFraction Incorrection (FiC)です。Fスコアは、重み付けの選択（最も単純なのは均等重み付け）によって、適合率と再現率を1つの数値に組み合わせたものです。バランスFスコア（F1スコア）として。いくつかの指標は回帰係数、すなわち有標度と情報量、およびそれらの幾何平均、マシューズ相関係数から得られます。その他の指標には、ユーデンのJ統計量、不確実性係数、ファイ係数、コーエンのカッパ係数などがあります

統計的二値分類

統計的分類は、機械学習において研究される問題であり、分類規則に基づいて分類が行われます。これは教師あり学習の一種であり、カテゴリが事前に定義された機械学習手法であり、新しい確率的観測をそれらのカテゴリに分類するために使用されます。カテゴリが2つしかない場合、この問題は統計的二値分類として知られています

バイナリ分類に一般的に使用される方法は次のとおりです。

各分類器は、観測数、特徴ベクトルの次元数、データ内のノイズ、その他多くの要因に基づいて、特定の領域においてのみ最適です。例えば、 3D点群においては、ランダムフォレストは SVM分類器よりも優れた性能を発揮します。^[2]^[3]

連続値をバイナリに変換する

二値分類は、連続関数を二値変数に変換する二分法の一種です。血液検査値など、結果が連続値となる検査は、カットオフ値を定義することで人工的に二値化することができ、結果値がカットオフ値より高いか低いかによって、検査結果が陽性または陰性と分類されます。

しかし、このような変換は情報の損失を招きます。なぜなら、結果として得られる二値分類では、値がカットオフ値よりどの程度上または下であるかが分からないからです。その結果、カットオフ値に近い連続値を二値値に変換すると、結果として得られる陽性または陰性の予測値は、通常、連続値から直接得られる予測値よりも高くなります。このような場合、検査結果を陽性または陰性のいずれかと指定することで、不適切に高い確実性があるように見せかけますが、実際には値は不確実な区間内にあります。例えば、尿中hCG濃度を連続値とした場合、尿中妊娠検査でhCG濃度が52 mIU/mlと測定された場合、カットオフ値が50 mIU/mlで「陽性」と表示されることがありますが、実際には不確実な区間内にあります。これは、元の連続値を知ることでのみ明らかになる場合があります。一方、カットオフ値から非常に離れた検査結果の場合、結果として得られる陽性または陰性の予測値は、通常、連続値から得られる予測値よりも低くなります。たとえば、尿中 hCG 値が 200,000 mIU/ml の場合、妊娠の可能性が非常に高くなりますが、バイナリ値に変換すると、52 mIU/ml の場合と同じように「陽性」と表示されます。

参照

参考文献

^ William Cullerne Bown (2024). 「感度と特異度と適合率と再現率、そして関連するジレンマ」 . Journal of Classification . 41 (2): 402– 426. doi :10.1007/s00357-024-09478-y.
^ Zhang & Zakhor, Richard & Avideh (2014). 「LiDARとカメラを用いた屋内点群上の窓領域の自動識別」VIP Lab Publications . CiteSeerX 10.1.1.649.303 .
^ Y. LuとC. Rasmussen (2012). 「3Dポイントクラウドの効率的なセマンティックラベリングのための簡略化されたマルコフ確率場」(PDF) . IROS .

参考文献

ネロ・クリスティアニーニ、ジョン・ショー＝テイラー著『サポートベクターマシンとその他のカーネルベース学習手法入門』ケンブリッジ大学出版局、2000年。ISBN 0-521-78019-5 （[1] SVMブック）
ジョン・ショー＝テイラー、ネロ・クリスティアニーニ著 『パターン分析のためのカーネル法』ケンブリッジ大学出版局、2004年。ISBN 0-521-81397-2（書籍のウェブサイト）
ベルンハルト・シェルコップ、AJ・スモラ著『Learning with Kernels』MIT Press、マサチューセッツ州ケンブリッジ、2002年。ISBN 0-262-19475-9

[CullerneBown2024-1] William Cullerne Bown (2024). 「感度と特異度と適合率と再現率、そして関連するジレンマ」 . Journal of Classification . 41 (2): 402– 426. doi :10.1007/s00357-024-09478-y.

[2] Zhang & Zakhor, Richard & Avideh (2014). 「LiDARとカメラを用いた屋内点群上の窓領域の自動識別」VIP Lab Publications . CiteSeerX 10.1.1.649.303 .

[3] Y. LuとC. Rasmussen (2012). 「3Dポイントクラウドの効率的なセマンティックラベリングのための簡略化されたマルコフ確率場」(PDF) . IROS .