陽性予測値と陰性予測値

陽性予測値と陰性予測値
陽性予測値と陰性予測値 - 2

陽性予測値と陰性の予測値(それぞれPPVNPV )は、統計診断検査における陽性結果と陰性結果のうち、それぞれ真陽性真陰性の結果となる割合です。[ 1 ] PPV と NPV は、診断検査やその他の統計的尺度の性能を表します。結果が高い場合は、そのような統計が正確であると解釈できます。PPV と NPV は、真陽性率真陰性率のように検査に固有のものではなく、有病率にも依存します。[ 2 ] PPV と NPV はどちらもベイズの定理を使用して導くことができます。

陽性予測値は、時に同義語として用いられることもありますが、一般的には対照群によって確立される値を指し、検査後確率は個人における確率を指します。しかし、対象疾患の個人の検査前確率が、陽性予測値を確立するために用いられた対照群の有病率と同じであれば、両者は数値的に等しくなります。

情報検索では、PPV 統計はしばしば精度と呼ばれます。

意味

陽性予測値(PPV)

陽性予測値(PPV)または精度は次のように定義される。

ペイパービュー真陽性の数真陽性の数+誤検出数真陽性の数肯定的な通話の数{\displaystyle {\text{PPV}}={\frac {\text{真陽性の数}}{{\text{真陽性の数}}+{\text{偽陽性の数}}}}={\frac {\text{真陽性の数}}{\text{陽性コールの数}}}}

ここで、「真陽性」とは、検査が陽性予測を示し、被験者がゴールドスタンダードにおいて陽性結果を示す事象であり、「偽陽性」とは、検査が陽性予測を示し、被験者がゴールドスタンダードにおいて陰性結果を示す事象です。完璧な検査におけるPPVの理想的な値は1(100%)であり、最悪の値は0となります。

PPV は、感度特異度、および疾患の 有病率から計算することもできます。

ペイパービュー感度×有病率感度×有病率+1特異性×1有病率{\displaystyle {\text{PPV}}={\frac {{\text{感度}}\times {\text{有病率}}}{{\text{感度}}\times {\text{有病率}}+(1-{\text{特異度}})\times (1-{\text{有病率}})}}}

ベイズの定理を参照

PPV の補数は偽発見率(FDR) です。

フランクリン・ルーズベルト1ペイパービュー誤検出数真陽性の数+誤検出数誤検出数肯定的な通話の数{\displaystyle {\text{FDR}}=1-{\text{PPV}}={\frac {\text{偽陽性の数}}{{\text{真陽性の数}}+{\text{偽陽性の数}}}}={\frac {\text{偽陽性の数}}{\text{陽性コールの数}}}}

陰性予測値(NPV)

陰性の予測値は次のように定義されます。

正味現在価値真陰性の数真陰性の数+偽陰性の数真陰性の数否定的な通話の数{\displaystyle {\text{NPV}}={\frac {\text{真陰性の数}}{{\text{真陰性の数}}+{\text{偽陰性の数}}}}={\frac {\text{真陰性の数}}{\text{陰性の判定数}}}}

ここで、「真陰性」とは、検査が陰性の予測を行い、被験者がゴールドスタンダードにおいて陰性の結果を示す事象であり、「偽陰性」とは、検査が陰性の予測を行い、被験者がゴールドスタンダードにおいて陽性の結果を示す事象です。偽陰性を示さない完璧な検査の場合、NPVの値は1(100%)であり、真陰性を示さない検査の場合、NPVの値は0です。

NPVは感度特異度有病率から計算することもできます。

正味現在価値特異性×1有病率特異性×1有病率+1感度×有病率{\displaystyle {\text{NPV}}={\frac {{\text{特異度}}\times (1-{\text{有病率}})}{{\text{特異度}}\times (1-{\text{有病率}})+(1-{\text{感度}})\times {\text{有病率}}}}}}
正味現在価値TT+F{\displaystyle {\text{NPV}}={\frac {TN}{TN+FN}}}

NPVの補集合は誤記率(FOR):

のために1正味現在価値偽陰性の数真陰性の数+偽陰性の数偽陰性の数否定的な通話の数{\displaystyle {\text{FOR}}=1-{\text{NPV}}={\frac {\text{偽陰性の数}}{{\text{真陰性の数}}+{\text{偽陰性の数}}}}={\frac {\text{偽陰性の数}}{\text{陰性判定の数}}}}

陰性予測値は、時に同義語として用いられることもありますが、一般的には対照群によって確立される値を指し、陰性検査後確率はむしろ個人における確率を指します。しかし、対象疾患の個人の検査前確率が、陰性予測値を確立するために用いられた対照群の有病率と同じであれば、両者は数値的に等しくなります。

関係

次の図は、陽性予測値陰性予測値感度、特異度がどのように関連しているかを示しています。

予測される条件出典: [ 3 ] [ 4 ] [ 5 ] [ 6 ] [ 7 ] [ 8 ] [ 9 ] [ 10 ]
総人口= P + N陽性と予測される予測陰性情報量ブックメーカーの情報量(BM)=TPR+TNR−1有病率閾値(PT)= √TPR × FPR − FPR/TPR − FPR
実際の状況
実正(P)[ a ]真陽性(TP)、ヒット[ b ]偽陰性(FN)、見逃し、過小評価真陽性率(TPR)、再現率感度(SEN)、検出確率、ヒット率、検出力= TP/P = 1 − FNR偽陰性率(FNR)、見逃し率タイプIIエラー[ c ] = FN/P = 1 − TPR
実負数(N)[ d ]偽陽性(FP)、誤警報、過大評価真陰性(TN)、正しい拒絶反応[ e ]偽陽性率(FPR)、誤報確率、フォールアウトタイプIエラー[ f ] = FP/ = 1 − TNR真陰性率(TNR)、特異度(SPC)、選択性= テネシー州/ = 1 − FPR
有病率= P/P + N陽性予測値(PPV)、精度= TP/TP + FP = 1 − FDR誤脱落率(FOR)= FN/TN + FN = 1 − NPV陽性尤度比(LR+)= TPR/FPR陰性尤度比(LR−) = FNR/TNR
精度(ACC)= TP + TN/P + N誤発見率(FDR)= FP/TP + FP = 1 − PPV陰性予測値(NPV)= テネシー州/TN + FN = 1 − のためにマーク度(MK)、デルタP(Δp)= PPV + NPV − 1診断オッズ比(DOR)= LR+/LR−
バランスのとれた精度(BA)TPR + TNR/2F 1スコア= 2 PPV × TPR/PPV + TPR = 2TP/2 TP + FP + FNフォークス・マロウズ指数(FM)= √PPV ×TPRファイまたはマシューズ相関係数(MCC) = √TPR × TNR × PPV × NPV - √FNR × FPR × FOR × FDR脅威スコア(TS)、クリティカル成功指数(CSI)、ジャカード指数= TP/TP + FN + FP
  1. ^データ内の実際の陽性症例数
  2. ^状態または特性の存在を正しく示す検査結果
  3. ^タイプIIエラー: 特定の条件または属性が欠如していると誤って示すテスト結果
  4. ^データ内の実際の陰性症例数
  5. ^状態または特徴の欠如を正しく示す検査結果
  6. ^第1種の誤り: 特定の条件または属性が存在すると誤って示すテスト結果

陽性予測値と陰性予測値は、有効な有病率推定値が得られる横断研究やその他の集団ベースの研究のデータを用いてのみ推定できることに注意してください。一方、感度と特異度は症例対照研究から推定できます。

実例

大腸がんの有無を調べるために、2,030人を対象に 便潜血(FOB)スクリーニング検査を行ったとします。

便潜血検査の結果
総人口(人口) = 2030年 検査結果陽性検査結果は陰性精度(ACC)
= (TP + TN) / 人口= (20 + 1820) / 2030 ≈ 90.64%
F 1スコア
= 2 × 精度×再現率/精度 + 再現率0.174
大腸がん患者(内視鏡検査で確認)実際の状況プラス(AP)= 30 (2030×1.48%) 真陽性(TP) = 20(2030 × 1.48% × 67%) 偽陰性(FN) = 10(2030 × 1.48% ×(100% − 67%)真陽性率(TPR)、再現率感度
= TP / AP = 20 / 30 ≈ 66.7%
偽陰性率(FNR)、見逃し率
= FN / AP = 10 / 30 ≈ 33.3%
実際の状況マイナス(AN)=2000 (2030× (100%−1.48%)偽陽性(FP) = 180(2030 ×(100% − 1.48%) ×(100% − 91%)真陰性(TN) = 1820(2030 ×(100% − 1.48%) × 91%) 偽陽性率(FPR)、フォールアウト誤報確率
= FP / AN = 180 / 2000 = 9.0%
特異性、選択性、真陰性率(TNR)
= TN / AN = 1820 / 2000 = 91%
有病率
= AP / 人口= 30 / 2030 ≈ 1.48%
陽性予測値(PPV)、精度
= TP / (TP + FP) = 20 / (20 + 180) = 10%
誤記率(FOR)
= FN / (FN + TN) = 10 / (10 + 1820) ≈ 0.55%
陽性尤度比(LR+)
= TPR/FPR = (20 / 30) / (180 / 2000) ≈ 7.41
陰性尤度比(LR−)
= FNR/TNR = (10 / 30) / (1820 / 2000) ≈ 0.366
誤発見率(FDR)
= FP / (TP + FP) = 180 / (20 + 180) = 90.0%
陰性予測値(NPV)
= TN / (FN + TN) = 1820 / (10 + 1820) ≈ 99.45%
診断オッズ比(DOR)
= LR+/LR−20.2

陽性予測値(PPV = 10%)が低いことは、この検査手順による陽性結果の多くが偽​​陽性であることを示しています。したがって、陽性結果が出た場合は、より信頼性の高い検査を実施し、がんの有無をより正確に評価する必要があります。しかしながら、そのような検査は、安価で簡便であれば有用となる可能性があります。FOBスクリーニング検査の強みは、むしろその陰性予測値にあります。つまり、個人が陰性であれば、その陰性結果が真であるという高い信頼性が得られます。

問題

その他の個人要因

PPVは検査固有のものではなく、有病率にも依存することに注意してください。[ 2 ]有病率が予測値に大きな影響を与えるため、PPVを有病率50%に正規化する標準化されたアプローチが提案されています。[ 11 ] PPVは疾患または病状の有病率に正比例します。上記の例では、検査対象者のグループに大腸がん患者の割合が高ければ、PPVはおそらく高くなり、NPVは低くなるでしょう。グループ内の全員が大腸がんを患っていた場合、PPVは100%、NPVは0%になります。

この問題を克服するために、NPVとPPVは、NPVとPPVの算出に使用した疾患群の患者数と健常対照群の患者数の比率が、研究対象集団における疾患の有病率と等しい場合、または2つの疾患群を比較する場合は、疾患群1の患者数と疾患群2の患者数の比率が、研究対象である2つの疾患の有病率の比率と等しい場合にのみ使用すべきである。それ以外の場合、尤度比は有病率に依存しないため、陽性尤度比と陰性尤度比の方がNPVやPPVよりも正確である。

検査対象者の検査前確率が、PPVおよびNPVを確立するために用いられた対照群の確率とは異なる場合、PPVおよびNPVは通常、陽性および陰性の検査後確率とは区別されます。PPVおよびNPVは対照群によって確立された確率を指し、検査後確率は検査対象者の確率(例えば尤度比によって推定されるもの)を指します。このような場合、同等の個人からなる大規模な集団を研究対象とし、それらの個人における検査の使用について、陽性予測値と陰性予測値を別々に確立することが望ましいです。

ベイズ更新

ベイズの定理は、疾患の有病率または検査前確率の関数として、スクリーニング検査の精度に固有の限界を課す。検査システムは、有病率の閾値と呼ばれる明確に定義された一定の点までは、有率の大幅な低下を許容できることが示されており、その点を下回ると、陽性スクリーニング検査の信頼性は急激に低下する。とはいえ、Balaylaら[ 12 ]は、逐次検査によって前述のベイズの限界を克服し、スクリーニング検査の信頼性を向上させることを示した。望ましい陽性予測値(ただし、)がある定数に近づく場合、必要な陽性検査の反復回数は次のようになる。 ρ{\displaystyle \rho }ρ<1{\displaystyle \rho <1}{\displaystyle k}n{\displaystyle n_{i}}

nリムρln[ϕ1ϕ1]ln[1つの1b]{\displaystyle n_{i}=\lim _{k\to \rho }\left\lceil {\frac {\ln \left[{\frac {k(\phi -1)}{\phi (k-1)}}\right]}{\ln \left[{\frac {a}{1-b}}\right]}}\right\rceil }

どこ

  • ρ{\displaystyle \rho }希望のPPV
  • n{\displaystyle n_{i}}達成するために必要なテストの反復回数です。ρ{\displaystyle \rho }
  • 1つの{\displaystyle a}感度は
  • b{\displaystyle b}特異性は
  • ϕ{\displaystyle \phi }病気の蔓延は

注目すべきは、上記の式の分母が陽性尤度比(LR+)の自然対数であることです。また、重要な前提として、検査は独立していなければならないことにも留意してください。Balaylaら[ 12 ]が述べているように、同じ検査を繰り返すとこの独立性の仮定に反する可能性があり、実際、「陽性予測値を高めるためのより自然で信頼性の高い方法は、可能であれば、最初の陽性結果が得られた後、全く異なるパラメータを持つ別の検査を併用することである」とされています。[ 12 ]

異なるターゲット条件

PPVは、検査結果が陽性の場合に、患者が実際に特定の疾患に罹患している確率を示すために使用されます。しかし、疾患の原因は複数存在する場合があり、単一の潜在的な原因が必ずしも患者に見られる明らかな疾患につながるとは限りません。PPVとNPVの関連する対象条件を混同する可能性があります。例えば、検査結果のPPVまたはNPV値が実際にはその疾患の素因のみを示すにもかかわらず、その値が疾患に罹患していると解釈するなどです。[ 13 ]

一例として、咽喉炎の患者に使用される微生物学的咽頭ぬぐい液があります。通常、咽頭ぬぐい液のPPVを示す出版物は、見つかった細菌によって患者が病気になったというのではなく、この細菌が咽頭に存在する可能性を報告しています。この細菌の存在が常に咽頭炎を引き起こすのであれば、PPVは非常に有用でしょう。しかし、細菌は人体に無害な方法で定着し、感染症や疾患を引き起こさないこともあります。これらの人の咽頭炎は、ウイルスなど他の病原体によって引き起こされます。このような状況では、評価研究で使用されるゴールドスタンダードは、細菌(無害である可能性があります)の存在のみを表し、原因となる細菌による咽頭炎疾患を表していません。この問題は、陰性予測値よりも陽性予測値に大きく影響することが証明されています。[ 14 ]ゴールドスタンダードが疾患の潜在的な原因のみを調べる診断検査を評価するために、病因予測値と呼ばれる予測値の拡張を使用できます。[ 13 ] [ 15 ]

参照

参考文献

  1. ^フレッチャー、ロバート・H・フレッチャー、スザンヌ・W. (2005).臨床疫学:エッセンシャルズ(第4版). メリーランド州ボルチモア:リッピンコット・ウィリアムズ・アンド・ウィルキンス. pp.  45. ISBN 0-7817-5215-9{{cite book}}: CS1 maint: 複数の名前: 著者リスト (リンク)
  2. ^ a b Altman, DG; Bland, JM (1994). 「診断検査2:予測値」 . BMJ . 309 (6947): 102. doi : 10.1136 / bmj.309.6947.102 . PMC 2540558. PMID 8038641 .  
  3. ^ Fawcett, Tom (2006). 「ROC分析入門」(PDF) .パターン認識レターズ. 27 (8): 861– 874. doi : 10.1016/j.patrec.2005.10.010 . S2CID 2027090 . 
  4. ^プロボスト、フォスター、トム・フォーセット (2013年8月1日). 「ビジネスのためのデータサイエンス:データマイニングとデータ分析的思考について知っておくべきこと」 . O'Reilly Media, Inc.
  5. ^ Powers, David MW (2011). 「評価:適合率、再現率、F値からROC、情報量、注目度、相関まで」 . Journal of Machine Learning Technologies . 2 (1): 37– 63.
  6. ^ Ting, Kai Ming (2011). Sammut, Claude; Webb, Geoffrey I. (編).機械学習百科事典. Springer. doi : 10.1007/978-0-387-30164-8 . ISBN 978-0-387-30164-8
  7. ^ Brooks, Harold; Brown, Barb; Ebert, Beth; Ferro, Chris; Jolliffe, Ian; Koh, Tieh-Yong; Roebber, Paul; Stephenson, David (2015年1月26日). 「WWRP/WGNE予報検証研究共同ワーキンググループ」 .オーストラリア気象気候研究協力機構. 世界気象機関. 2019年7月17日閲覧
  8. ^ Chicco D, Jurman G (2020年1月). 「二値分類評価におけるF1スコアと精度に対するマシューズ相関係数(MCC)の利点」 . BMC Genomics . 21 (1): 6-1–6-13. doi : 10.1186/s12864-019-6413-7 . PMC 6941312. PMID 31898477 .  
  9. ^ Chicco D, Toetsch N, Jurman G (2021年2月). 「2クラス混同行列評価において、マシューズ相関係数(MCC)はバランス精度、ブックメーカー情報、マーク度よりも信頼性が高い」 . BioData Mining . 14 (13): 13. doi : 10.1186/s13040-021-00244-z . PMC 7863449. PMID 33541410 .  
  10. ^ Tharwat A. (2018年8月). 「分類評価方法」 .応用コンピューティングと情報科学. 17 : 168–192 . doi : 10.1016/j.aci.2018.08.003 .
  11. ^ Heston, Thomas F. (2011). 「診断画像研究における予測値の標準化」(PDF) . Journal of Magnetic Resonance Imaging . 33 (2): 505, 著者返信 506–7. doi : 10.1002/jmri.22466 . PMID 21274995 . 
  12. ^ a b cジャック・バライラ. ベイズ更新と逐次検定:スクリーニング検査の推論限界の克服. BMC Med Inform Decis Mak 22, 6 (2022). https://doi.org/10.1186/s12911-021-01738-w
  13. ^ a b Gunnarsson, Ronny K.; Lanke, Jan (2002). 「無症候性キャリアが存在する場合の微生物学的診断検査の予測値」 . Statistics in Medicine . 21 (12): 1773–85 . doi : 10.1002 / sim.1119 . PMID 12111911. S2CID 26163122 .  
  14. ^ Orda, Ulrich; Gunnarsson, Ronny K; Orda, Sabine; Fitzgerald, Mark; Rofe, Geoffry; Dargan, Anna (2016). 「咽喉痛を呈する患者における咽喉スワブからのA群連鎖球菌抗原検出における迅速免疫測定法の病因予測値」(PDF) . International Journal of Infectious Diseases . 45 (4月): 32–5 . doi : 10.1016/j.ijid.2016.02.002 . PMID 26873279 . 
  15. ^ Gunnarsson, Ronny K. 「EPV Calculator」サイエンスネットワークTV