標準スコア

標準偏差、累積パーセンテージ、パーセンタイル相当値、Zスコア、Tスコアなど、正規分布におけるさまざまな評価方法の比較

統計学において、標準得点またはZスコアとは、の得点(すなわち、観測値またはデータポイント)が、観測または測定されているものの平均値を上回るか下回るかの標準偏差の数です。生の得点が平均値を上回る場合、標準得点は正となり、平均値を下回る場合、標準得点は負となります。

これは、個々の素点から母集団平均を差し引き、その差を母集団標準偏差で割ることによって算出されます。素点を標準点に変換するこのプロセスは、標準化または正規化と呼ばれます(ただし、「正規化」はさまざまな種類の比率を指す場合があります。詳しくは正規化を参照してください)。

標準スコアは一般的にZスコアと呼ばれます。この記事でもそうであるように、この2つの用語は同じ意味で使用されます。他に、Z値Z統計量正規スコア標準化変数高エネルギー物理学におけるプルなど、同義の用語が使用されています。[ 1 ] [ 2 ]

Z スコアを計算するには、データ ポイントが属する完全な母集団の平均と標準偏差を知っている必要があります。母集団からの観測値のサンプルしかない場合は、サンプル平均とサンプル標準偏差を使用した同様の計算によってt統計量が得られます。

計算

母平均と母標準偏差が分かっている場合、生のスコア xは[ 3 ]によって標準スコアに変換される。

z×μσ{\displaystyle z={x-\mu \over \sigma }}

どこ:

μは母集団の平均であり、
σは母集団の標準偏差です。

zの絶対値は、生のスコアxと母集団の平均との間の距離を標準偏差の単位で表します。生のスコアが平均より下の場合には zは負になり、上の場合には正になります。

この式を用いてZを計算するには、標本平均値や標本偏差ではなく、母集団平均値と母集団標準偏差を使用する必要があります。しかし、標準化されたテストのように母集団全体を測定する場合を除き、母集団の真の平均値と標準偏差を知ることは、多くの場合非現実的です。

母集団平均値と母集団標準偏差が不明な場合は、標本平均値と標本標準偏差を母集団値の推定値として用いて標準得点を推定することができる。[ 4 ] [ 5 ] [ 6 ] [ 7 ]

これらの場合、Zスコアは次のように与えられる。

z×ׯS{\displaystyle z={x-{\bar {x}} \over S}}

どこ:

ׯ{\displaystyle {\bar {x}}}サンプルの平均であり、
Sはサンプルの標準偏差です。

常に言及すべきことですが、母集団統計量と標本統計量の区別はしばしば行われていません。どちらの場合も、方程式の分子と分母は同じ測定単位を持つため、除算によって単位が打ち消され、zは無次元量として残ります。

アプリケーション

Z検定

Zスコアは、標準化された検定におけるZ検定でよく用いられます。これは、母集団のパラメータが推定値ではなく既知である場合のスチューデントのt検定に類似したものです。母集団全体のパラメータが既知であることは非常に稀であるため、t検定の方がはるかに広く用いられています。

予測区間

標準スコアは予測区間 の計算に使用できます。予測区間[ L , U ]は、 Lで示される下限値とUで示される上限値から成り、将来の観測値Xが高確率でその区間内に存在する区間です。つまり、 γ{\displaystyle \gamma}

PL<X<あなたγ{\displaystyle P(L<X<U)=\ガンマ ,}

Xの標準得点Zは次のようになる。[ 8 ]

PLμσ<Z<あなたμσγ{\displaystyle P\left({\frac {L-\mu }{\sigma }Z<{\frac {U-\mu }{\sigma }}\right)=\gamma .}

次のように分位数zを決定することによって

Pz<Z<zγ{\displaystyle P\left(-z<Z<z\right)=\gamma }

それは次のようになります:

Lμzσ あなたμ+zσ{\displaystyle L=\mu -z\sigma ,\ U=\mu +z\sigma }

プロセス制御

プロセス制御アプリケーションでは、Z 値はプロセスが目標から外れて動作している程度の評価を提供します。

異なる尺度で測定されたスコアの比較:ACTとSAT

学生AのZスコアは1で、これは学生Aが平均値より1標準偏差高いことを意味します。したがって、学生ASATの成績は84.13パーセンタイルでした。

スコアが異なる尺度で測定されている場合、比較を容易にするためにZスコアに変換されることがあります。Dietzら[ 9 ]は、高校の(旧) SATACTのスコアを比較した以下の例を示しています。表は、SATとACTの合計スコアの平均と標準偏差を示しています。生徒AがSATで1800点、生徒BがACTで24点だったとします。どちらの生徒が他の受験者と比較して優れた成績を収めたでしょうか?

土曜 活動
平均 1500 21
標準偏差 300 5
学生BのZスコアは0.6で、これは学生Bが平均値より標準偏差0.6高いことを意味します。したがって、学生BのSATの成績は72.57パーセンタイルでした。

生徒AのZスコアはz×μσ180015003001{\displaystyle z={x-\mu \over \sigma }={1800-1500 \over 300}=1}

生徒BのZスコアはz×μσ242150.6{\displaystyle z={x-\mu \over \sigma }={24-21 \over 5}=0.6}

学生 A の Z スコアは学生 B よりも高いため、学生 A は他の受験者と比較して学生 B よりも優れた成績を収めました。

Zスコア以下の観測値の割合

ACT と SAT のスコアの例を続けると、ACT と SAT のスコアが両方とも正規分布していると仮定できる場合(これはほぼ正しいです)、Z スコアを使用して、学生 A および B よりも低いスコアを取得した受験者の割合を計算できます。

クラスター分析と多次元尺度法

「多次元尺度法やクラスター分析などの多変量解析手法では、データ内の単位間の距離という概念がしばしば非常に重要で興味深いものです。多変量データセット内の変数が異なるスケールにある場合、何らかの標準化を行った上で距離を計算する方が理にかなっています。」[ 10 ]

主成分分析

主成分分析では、「異なる尺度で測定された変数、または範囲が大きく異なる共通の尺度で測定された変数は、しばしば標準化される。」[ 11 ]

重回帰分析における変数の相対的重要性:標準化回帰係数

重回帰分析の前に変数を標準化することは、解釈を助けるために時々使用されます。[ 12 ] (95ページ)は次のように述べています。

標準化回帰傾きとは、X と Y が標準化されている場合の回帰方程式の傾きです。X と Y の標準化は、各観測セットからそれぞれの平均を差し引き、それぞれの標準偏差で割ることによって行われます。複数の X 変数が使用される多重回帰では、標準化回帰係数によって各 X 変数の相対的な寄与が定量化されます。

しかし、Kutnerら[ 13 ](p 278)は次のような注意を促している。「…標準化されているか否かに関わらず、回帰係数の解釈には注意が必要である。その理由は、予測変数同士が相関している場合、…回帰係数はモデル内の他の予測変数の影響を受けるからである…標準化回帰係数の大きさは、予測変数間の相関の存在だけでなく、各変数における観測値の間隔にも影響を受ける。これらの間隔は、場合によっては極めて恣意的となることがある。したがって、標準化回帰係数の大きさを、予測変数の相対的重要性を反映するものと解釈することは、通常、賢明ではない。」

数理統計における標準化

数理統計学では、確率変数Xは、その期待値を差し引き、その差を標準偏差で割ることによって標準化されるE[X]{\displaystyle \operatorname {E} [X]}σXヴァールX:{\displaystyle \sigma (X)={\sqrt {\operatorname {Var} (X)}}:}

ZXE[X]σX{\displaystyle Z={X-\operatorname {E} [X] \over \sigma (X)}}

検討中のランダム変数がXのランダムサンプルのサンプル平均である場合:  X1Xn{\displaystyle \X_{1},\dots,X_{n}}

X¯1n1nX{\displaystyle {\bar {X}}={1 \over n}\sum _{i=1}^{n}X_{i}}

標準化されたバージョンは

ZX¯E[X¯]σX/n{\displaystyle Z={\frac {{\bar {X}}-\operatorname {E} [{\bar {X}}]}{\sigma (X)/{\sqrt {n}}}}}
標準化されたサンプル平均の分散は次のように計算されました。
ヴァール×ヴァール×nヴァール×nσ2ヴァールX¯ヴァール×n1n2ヴァール×nσ2n2σ2n{\displaystyle {\begin{array}{l}\operatorname {Var} \left(\sum x_{i}\right)=\sum \operatorname {Var} (x_{i})=n\operatorname {Var} (x_{i})=n\sigma ^{2}\\\operatorname {Var} ({\overline {X}})=\operatorname {Var} \left({\frac {\sum x_{i}}{n}}\right)={\frac {1}{n^{2}}}\operatorname {Var} \left(\sum x_{i}\right)={\frac {n\sigma ^{2}}{n^{2}}}={\frac {\sigma ^{2}}{n}}\end{array}}}

Tスコア

教育評価において、Tスコアは標準得点Zをシフトし、平均50、標準偏差10になるように尺度化した値である。[ 14 ] [ 15 ] [ 16 ]日本語では変得点とも呼ばれ、その概念は高校や大学の入学の文脈でより広く知られ、使用されている。[ 17 ]

骨密度測定において、Tスコアは30歳の健康な成人の集団と比較した測定値の標準スコアであり、通常は平均が0で標準偏差が1である。[ 18 ]

参照

参考文献

  1. ^ Mulders, Martijn; Zanderighi, Giulia, eds. (2017). 2015 ヨーロッパ高エネルギー物理学スクール:ブルガリア、バンスコ 2015年9月2日~15日. CERNイエローレポート:スクール議事録. ジュネーブ:CERN. ISBN 978-92-9083-472-4
  2. ^ Gross, Eilam (2017-11-06). 「高エネルギー物理学のための実践的統計」 . CERN Yellow Reports: School Proceedings . 4/2017: 165–186 . doi : 10.23730/CYRSP-2017-004.165 .
  3. ^ E. Kreyszig (1979). Advanced Engineering Mathematics (第4版). Wiley. p. 880, eq. 5. ISBN 0-471-02140-7
  4. ^シュピーゲル、マレー・R.、スティーブンス、ラリー・J(2008年)、シャウムのアウトライン統計(第4版)、マグロウヒル、ISBN 978-0-07-148584-5
  5. ^メンデンホール、ウィリアム; シンシッチ、テリー (2007)、『工学と科学のための統計』(第5版)、ピアソン/プレンティスホール、ISBN 978-0131877061
  6. ^ Glantz, Stanton A.; Slinker, Bryan K.; Neilands, Torsten B. (2016)『応用回帰分析と分散分析入門(第3版)』McGraw Hill、ISBN 978-0071824118
  7. ^ Aho, Ken A. (2014)、生物学者のための基礎および応用統計学(初版)、Chapman & Hall / CRC Press、ISBN 978-1439873380
  8. ^ E. Kreyszig (1979). Advanced Engineering Mathematics (第4版). Wiley. p. 880, eq. 6. ISBN 0-471-02140-7
  9. ^ Diez, David; Barr, Christopher; Çetinkaya-Rundel, Mine (2012), OpenIntro Statistics (第2版), openintro.org
  10. ^エヴェリット、ブライアン、ホットホーン、トルステン J (2011)、『Rによる応用多変量解析入門』、シュプリンガー、pp.  14– 15、ISBN 978-1441996497
  11. ^ジョンソン、リチャード; ウィチャーン、ウィチャーン (2007)、『応用多変量統計分析』、ピアソン/プレンティスホール
  12. ^アフィフィ、アブデルモネム; メイ、スザンヌ・K.; クラーク、バージニア・A. (2012) 『実践多変量解析』(第5版)チャップマン&ホール/CRC、ISBN 978-1439816806
  13. ^クトナー、マイケル; ナハトハイム、クリストファー; ネター、ジョン(204)『応用線形回帰モデル』(第4版)、マグロウヒル、ISBN 978-0073014661{{citation}}: ISBN / Date incompatibility (help)
  14. ^ジョン・サルビア、ジェームズ・イッセルダイク、サラ・ウィトマー(2009年1月29日)『アセスメント:特別支援教育とインクルーシブ教育』Cengage Learning. pp. 43–. ISBN 978-0-547-13437-6
  15. ^エドワード・S・ニュークルグ、R・チャールズ・フォーセット(2014年1月1日)『テストと評価のエッセンシャルズ:カウンセラー、ソーシャルワーカー、心理学者のための実践ガイド』 Cengage Learning. pp. 133–. ISBN 978-1-305-16183-2
  16. ^ Kamphaus, Randy W. (2005年8月16日).児童・青年知能の臨床評価(第2版). Springer. p. 123. doi : 10.1007/978-0-387-29149-9 . ISBN 978-0-387-26299-4
  17. ^グッドマン、ロジャー;岡千波(2018年9月3日)日本の教育における変得点(標準化された順位得点)の発明、ゲーム化、そして持続」オックスフォード教育レビュー44 (5): 581–598 . doi : 10.1080 /03054985.2018.1492375 . ISSN 0305-4985 . JSTOR 26836035 .  
  18. ^ 「骨量測定:数値の意味」 NIH骨粗鬆症および関連骨疾患国立リソースセンター国立衛生研究所。2017年8月5日閲覧

さらに読む

  • キャロル、スーザン・ロベッツィ; キャロル、デイビッド・J. (2002). 『学校リーダーのための統計学入門』(イラスト入り). ロウマン&リトルフィールド. ISBN 978-0-8108-4322-6. 2009年6月7日閲覧
  • ラーセン、リチャード・J.; マルクス、モリス・L. (2000). 『数理統計とその応用入門(第3版)』 プレンティス・ホール. p. 282. ISBN 0-13-922303-7