ファンデルワールデンテスト

オランダの数学者バーテル・レーンダート・ファン・デル・ヴェルデンにちなんで名付けられたファン・デル・ヴェルデン検定は、k個の母集団分布関数が等しいかどうかを検定する統計検定です。ファン・デル・ヴェルデン検定は、標準的なクラスカル・ワリス検定の順位を標準正規分布の分位値（詳細は後述）に変換します。これらは正規スコアと呼ばれ、検定はこれらの正規スコアから計算されます。

k母集団バージョンのテストは、Van der Waerden (1952、1953) によって公開された 2 つの母集団のテストの拡張版です。

背景

分散分析（ANOVA）は、多因子モデルにおける因子（独立変数）の有意性を調べるためのデータ分析手法です。1因子モデルは、2標本t検定の一般化と考えることができます。つまり、2標本t検定は、2つの母集団平均値が等しいという仮説を検定するものです。1因子ANOVAは、k個の母集団平均値が等しいという仮説を検定します。標準的なANOVAでは、誤差（すなわち残差）が正規分布すると仮定します。この正規性の仮定が妥当でない場合は、ノンパラメトリック検定を使用するという代替手段があります。

テストの定義

データ中のk個のグループ（すなわちサンプル）のそれぞれのサンプルサイズをn _j ( j = 1, 2, ..., k )で表す。Nを全グループのサンプルサイズとする。X _{ij を}j番目^のグループのi^番目の値とする。正規分布のスコアは次のように計算される。

A_{ij}=\Phi ^{-1}\left({\frac {R(X_{ij})}{N+1}}\right)

ここで、R ( X _ij ) は観測値X _ijの順位を表し、Φ ⁻¹は正規分布の分位関数を表す。各サンプルの正規分布の平均は次のように計算される。

{\bar {A}}_{j}={\frac {1}{n_{j}}}\sum _{i=1}^{n_{j}}A_{ij}\quad j=1,2,\ldots ,k

正規分布の分散は次のように計算できる。

s^{2}={\frac {1}{N-1}}\sum _{j=1}^{k}\sum _{i=1}^{n_{j}}A_{ij}^{2}

Van der Waerden テストは次のように定義できます。

H _{0 :}k個の母集団分布関数はすべて同じ観測値をもたらす傾向がある

H _a : 少なくとも1つの集団は、他の少なくとも1つの集団よりも大きな観測値をもたらす傾向がある

検定統計量は

T_{1}={\frac {1}{s^{2}}}\sum _{j=1}^{k}n_{j}{\bar {A}}_{j}^{2}

有意水準αの場合、臨界領域は

T_{1}>\chi _{\alpha ,k-1}^{2}

ここで、Χ _{α,k − 1}²は自由度k − 1のカイ二乗分布のα分位数である。検定統計量が棄却域にある場合、帰無仮説は棄却される。分布が同一であるという仮説が棄却された場合、多重比較の手順を実行して、どの母集団のペアが異なる傾向があるかを判断することができる。母集団j ₁とj ₂が異なるように見えるのは、次の不等式が満たされる場合である。

\left\vert {\bar {A}}_{j_{1}}-{\bar {A}}_{j_{2}}\right\vert >s\,t_{1-\alpha /2}{\sqrt {\frac {N-1-T_{1}}{Nk}}}{\sqrt {{\frac {1}{n_{j_{1}}}}+{\frac {1}{n_{j_{2}}}}}}}

t _{1 − α/2}はt分布の(1 − α/2)分位数です。

クラスカル・ワリス検定との比較

1因子モデルに対する最も一般的なノンパラメトリック検定は、Kruskal-Wallis検定です。Kruskal-Wallis検定は、データの順位に基づいています。Van Der Waerden検定の利点は、正規性仮定が満たされている場合に標準的な分散分析と同等の高い効率性が得られるだけでなく、正規性仮定が満たされていない場合にもKruskal-Wallis検定と同等の堅牢性が得られることです。

参考文献

Conover, WJ (1999).実用ノンパラメトリクス統計（第3版）. Wiley. pp. 396– 406.

van der Waerden, BL (1952). 「2標本問題における順序検定とその検出力」, Indagationes Mathematicae , 14, 453–458.
ファン・デル・ワールデン、BL（1953年）。「2 サンプル問題の順序テスト。II、III」、Koninklijke Nederlandse Akademie van Wetenschappen の議事録、Serie A、564、303 ～ 310、311 ～ 316。

パブリックドメインこの記事には、米国国立標準技術研究所のパブリックドメイン資料が組み込まれています。