オランダの数学者バーテル・レーンダート・ファン・デル・ヴェルデンにちなんで名付けられた ファン・デル・ヴェルデン検定 は、k個の 母集団分布関数が等しいかどうかを検定する統計検定 です。ファン・デル・ヴェルデン検定は、標準的なクラスカル・ワリス検定 の順位を標準正規分布の分位値 (詳細は後述)に変換します。これらは正規スコアと呼ばれ、検定はこれらの正規スコアから計算されます。
k 母集団バージョンのテストは、Van der Waerden (1952、1953) によって公開された 2 つの母集団のテストの拡張版です。
背景 分散分析 (ANOVA)は、多因子モデルにおける因子(独立変数)の有意性を調べるための データ分析手法です。1因子モデルは 、2標本t検定 の一般化と考えることができます。つまり、2標本t検定は、2つの母集団平均値が等しいという仮説を検定するものです。1因子ANOVAは、k個の 母集団平均値が等しいという仮説を検定します。標準的なANOVAでは、誤差(すなわち残差)が正規分布すると仮定します。この正規性の仮定が妥当でない場合は、 ノンパラメトリック検定を 使用するという代替手段があります。
テストの定義 データ中のk個 のグループ(すなわちサンプル)のそれぞれのサンプルサイズをn j ( j = 1, 2, ..., k )で表す。Nを 全グループのサンプルサイズとする。X ij を j 番目 の グループのi 番目の 値とする。正規分布のスコアは次のように計算される。
あ 私 j = Φ − 1 ( R ( X 私 j ) 北 + 1 ) {\displaystyle A_{ij}=\Phi ^{-1}\left({\frac {R(X_{ij})}{N+1}}\right)} ここで、R ( X ij ) は観測値X ij の順位を表し、Φ −1 は正規分布の分位関数 を表す。各サンプルの正規分布の平均は次のように計算される。
あ ¯ j = 1 n j ∑ 私 = 1 n j あ 私 j j = 1 、 2 、 … 、 け {\displaystyle {\bar {A}}_{j}={\frac {1}{n_{j}}}\sum _{i=1}^{n_{j}}A_{ij}\quad j=1,2,\ldots ,k} 正規分布の分散は次のように計算できる。
s 2 = 1 北 − 1 ∑ j = 1 け ∑ 私 = 1 n j あ 私 j 2 {\displaystyle s^{2}={\frac {1}{N-1}}\sum _{j=1}^{k}\sum _{i=1}^{n_{j}}A_{ij}^{2}} Van der Waerden テストは次のように定義できます。
H 0 : k個 の母集団分布関数はすべて同じ観測値をもたらす傾向がある H a : 少なくとも1つの集団は、他の少なくとも1つの集団よりも大きな観測値をもたらす傾向がある 検定統計量は
T 1 = 1 s 2 ∑ j = 1 け n j あ ¯ j 2 {\displaystyle T_{1}={\frac {1}{s^{2}}}\sum _{j=1}^{k}n_{j}{\bar {A}}_{j}^{2}} 有意水準 αの場合、臨界領域は
T 1 > χ α 、 け − 1 2 {\displaystyle T_{1}>\chi _{\alpha ,k-1}^{2}} ここで、Χ α,k − 1 2 は自由度k − 1のカイ二乗分布 のα分位数である。検定統計量が棄却域にある場合、帰無仮説は棄却される。分布が同一であるという仮説が棄却された場合、 多重比較の 手順を実行して、どの母集団のペアが異なる傾向があるかを判断することができる。母集団j 1 とj 2 が異なるように見えるのは、次の不等式が満たされる場合である。
| あ ¯ j 1 − あ ¯ j 2 | > s t 1 − α / 2 北 − 1 − T 1 北 − け 1 n j 1 + 1 n j 2 {\displaystyle \left\vert {\bar {A}}_{j_{1}}-{\bar {A}}_{j_{2}}\right\vert >s\,t_{1-\alpha /2}{\sqrt {\frac {N-1-T_{1}}{Nk}}}{\sqrt {{\frac {1}{n_{j_{1}}}}+{\frac {1}{n_{j_{2}}}}}}}} t 1 − α/2 はt分布 の(1 − α/2)分位数 です。
クラスカル・ワリス検定との比較 1因子モデルに対する最も一般的なノンパラメトリック検定は、Kruskal-Wallis検定 です。Kruskal-Wallis検定は、データの順位に基づいています。Van Der Waerden検定の利点は、正規性仮定が満たされている場合に標準的な分散分析と同等の高い効率性が得られるだけでなく、正規性仮定が満たされていない場合にもKruskal-Wallis検定と同等の堅牢性が得られることです。
参考文献 Conover, WJ (1999).実用ノンパラメトリクス統計 (第3版). Wiley. pp. 396– 406. van der Waerden, BL (1952). 「2標本問題における順序検定とその検出力」, Indagationes Mathematicae , 14, 453–458. ファン・デル・ワールデン、BL(1953年)。 「2 サンプル問題の順序テスト。II、III」、Koninklijke Nederlandse Akademie van Wetenschappen の議事録、Serie A 、564、303 ~ 310、311 ~ 316。 この記事には、米国国立標準技術研究所 のパブリックドメイン資料が組み込まれています。