二元配置分散分析

2つのカテゴリ変数が1つの連続変数に与える影響を調べる統計検定

統計学において、二元配置分散分析（ANOVA）は、2つのカテゴリ独立変数が1つの連続従属変数にどのように影響するかを調べるために使用されます。^[1]これは、一元配置分散分析（ANOVA）を拡張したもので、両方の因子を同時に分析することができます。二元配置分散分析は、各独立変数の主効果と、それらの間の交互作用の有無を評価します。^[1]

研究者はこの検定を用いて、2つの要因が独立して作用するのか、それとも複合的に作用して従属変数に影響を与えるのかを検証します。心理学、農業、教育、生物医学研究などの分野で用いられています。^[2]例えば、肥料の種類と水位が植物の成長にどのような影響を与えるかを調べるのに使用できます。この分析では、グループ間で観察された差が統計的に有意であるかどうかを示すF統計量が生成されます。^[3]^[2]

歴史

二元配置分散分析は、近代実験計画法の隆盛期である20世紀初頭に開発されました。^[4] 1925年、ロナルド・フィッシャーは著書『研究者のための統計的手法』 （第7章と第8章）の中で二元配置分散分析について言及しました。フィッシャーは、この研究を通して、実験結果のばらつきは複数の原因に起因する可能性があることを示しました。^[4]

1934年、フランク・イェイツはフィッシャーのアプローチを拡張し、不均等なサンプルサイズ（不均衡なデザイン）の場合の計算手順を提案した。^[5]これにより、この手法は現実世界の実験においてより実用的なものとなった。その後の研究により、二元配置分散分析の理論は洗練され、例えば1993年には不均衡なデータを持つモデルに焦点を当てた藤越康則によるレビューも発表された。^[3]

20世紀後半の統計計算の発展に伴い、二元配置分散分析（ANOVA）はSAS（ソフトウェア）、SPSS、R（ソフトウェア）などのソフトウェアで広く利用できるようになりました。2005年、アンドリュー・ゲルマンは分散分析（ANOVA）を多層モデルとして新たな解釈で提唱し^[2]、単一の仮説検定ではなく、階層的な変動要因を記述する方法として位置づけました。この見解は現代の統計学においても影響力を及ぼしています。

二元配置分散分析（ATV）の開発は、因子データの分析の基礎となりました。次のセクションでは、この種の分析におけるデータの配置方法について説明します。

データセット

従属変数が、変動の潜在的な原因となる2つの因子の影響を受ける可能性のあるデータセットを考えてみましょう。第1因子はレベル（）を持ち、第2因子はレベル（）を持ちます。それぞれの組み合わせが1つの処理を定義し、合計で個の処理が定義されます。処理iの反復回数はで表され、はこの処理における反復回数のインデックス（）とします。^[1] $I$ $i\in \{1,\ldots ,I\}$ $J$ $j\in \{1,\ldots ,J\}$ $(i,j)$ $I\times J$ $(i,j)$ $n_{ij}$ $k$ $k\in \{1,\ldots ,n_{ij}\}$

これらのデータから、分割表を作成することができます。

$n_{i+}=\sum _{j=1}^{J}n_{ij}$ そして、 $n_{+j}=\sum _{i=1}^{I}n_{ij}$

そして、反復実験の総数は

$n=\sum _{i,j}n_{ij}=\sum _{i}n_{i+}=\sum _{j}n_{+j}$ . ^[1]

実験計画がバランス型かアンバランス型かは、各処理間の観測値の分布によって決まります。各処理の反復回数Kが同じであれば、実験計画はバランス型です。この場合、実験計画は直交型であり、両因子の影響を独立して区別することができます。したがって、

$\forall i,j\;n_{ij}=K$ 、

そして

$\forall i,j\;n_{ij}={\frac {n_{i+}\cdot n_{+j}}{n}}$ 。

肥料の種類（要因A）と灌漑レベル（要因B）が植物の成長にどのような影響を与えるかを調べる農業研究を考えてみましょう。それぞれの肥料と灌漑の組み合わせが1つの処理を表し、各グループ内で複数の植物が反復測定されます。

肥料の種類	低灌漑	高灌漑
なし	7、2、1	7、6
硝酸塩	11、6	11、7、3
リン酸	5、3、4	11、4

この表は、行が1つの因子、列が別の因子、そして各セルが1つの処理の組み合わせを表す、典型的な2元配置を示しています。この配置は、2つの因子とその相互作用が従属変数にどのように影響するかを分析するための基礎となります。

このデータ構造は、二元配置分散分析（ANOVA）で使用される統計モデルの基礎となります。各処理の組み合わせを数学的に定義することで、モデルは因子とその相互作用が応答変数にどのように影響するかを記述することができます。

モデル

例えばヒストグラムを用いて全てのデータポイント間の変動を観察する場合、「そのような変動を記述するために確率を用いることができる」^[6] 。したがって、観測値が治療における第- 番目の指標となるランダム変数をと表記する。二元配置分散分析（ANOVA）は、これらの変数全てが平均を中心に独立かつ正規分布的に変動し、一定の分散（等分散性）を持つとモデル化する。^[6] $n$ $Y_{ijk}$ $y_{ijk}$ $k$ $(i,j)$ $\mu_{ij}$ $\sigma ^{2}$

$Y_{ijk}\,|\,\mu _{ij},\sigma ^{2}\;{\overset {\mathrm {iid} }{\sim }}\;{\mathcal {N}}(\mu _{ij},\sigma ^{2})$ 。

具体的には、応答変数の平均は説明変数の線形結合としてモデル化されます。

$\mu _{ij}=\mu +\alpha _{i}+\beta _{j}+\gamma _{ij}$ 、

どこ：

$\mu$ すべての観測の総平均である
$\alpha _{i}$ 第一因子のレベルiの主効果である
$\beta_{j}$ は第2因子のレベルjの主効果である
$\gamma_{ij}$ 相互作用効果は、2 つの要因の組み合わせがそれぞれの個別の効果の合計からどの程度逸脱するかを表します。

二元配置分散分析（ANOVA）を記述する別の方法として、因子によって説明される変動に加えて、統計的なノイズがいくらか残るという点を挙げる方法があります。この説明できない変動は、データポイントごとに1つのランダム変数（誤差）を導入することで処理されます。^[6]これらのランダム変数は平均値からの偏差として扱われ、独立かつ正規分布すると仮定されます。 $\epsilon _{ijk}$ $n$

$Y_{ijk}=\mu _{ij}+\epsilon _{ijk}{\text{ with }}\epsilon _{ijk}{\overset {\mathrm {iid} }{\sim }}{\mathcal {N}}(0,\sigma ^{2})$ . ^[6]

数学モデルは妥当性を保証するためにいくつかの仮定に基づいています。これらの仮定は、分散分析の理論的定式化と、結果の正確な解釈に必要な条件を結び付けます。

仮定

二元配置分散分析の妥当性は、モデルとデータに関するいくつかの仮定に依存します。これらの仮定は、因子効果を比較するために使用される統計的検定が信頼できるものであり、結果が有意義に解釈できることを保証します。GelmanとHillによれば、分散分析、そしてより一般的には一般線型モデルの仮定は、重要度の高い順に以下の通りです。^[7]

データの関連性：データは調査対象を反映するものでなければなりません。例えば、肥料と灌漑に関する研究では、植物の成長の測定値は、土壌の違いや測定誤差といった無関係な変動ではなく、比較対象となる処理方法を直接反映するものでなければなりません。
加法性と線形性：交互作用項が含まれていない限り、応答変数の平均は因子によって加法的かつ線形的に影響を受けます。これは、各因子の効果は結果を予測する形で組み合わされ、加法性からの逸脱は交互作用項によって表されることを意味します。
誤差の独立性：誤差（または残差）は観測値間で独立していなければなりません。肥料と灌漑の例では、ある植物の成長が別の植物の成長測定に影響を与えるべきではありません。そうでなければ、独立性の仮定は破られます。
分散の等質性：従属変数の分散は、すべての治療の組み合わせにおいてほぼ等しくなければなりません（等分散性）。^[1]これにより、どのグループも全体の結果に不均衡な影響を与えないことが保証されます。
残差の正規性：各治療の組み合わせにおける残差は、ほぼ正規分布に従うはずである。^{[1]この仮定により、小規模なサンプルでも有効な}F検定と信頼区間が得られるが、サンプルサイズが大きい場合、分散分析は正規分布からの中程度の偏差に対しても堅牢である。^[6]

これらの仮定に違反すると、タイプIの誤り率を膨らませたり、統計的検出力が低下したりして、有意性検定が歪む可能性があります。^[1]これらの条件が満たされない場合、研究者はデータ変換を適用したり、ノンパラメトリック検定を使用したり、一般化線形モデルを採用したりして、データをより適切に処理することがあります。

これらの仮定が適切に満たされると、モデルパラメータを推定して、要因の主な影響と相互作用の影響を定量化できます。

これらの仮定が満たされれば、モデルパラメータを設定できます。パラメータ推定は、各因子の寄与と、全体的な分析におけるそれらの相互作用を定量化します。

パラメータ推定

データが分散分析の仮定（正規性や等分散など）を満たしていることを確認した後、次のステップはモデルパラメータを推定することです。パラメータ推定の目的は、因子とその相互作用が結果にどのように影響するかを最もよく表す値を見つけることです。

二元配置分散分析モデルにおけるパラメータの 識別可能性を確保するために、因子効果には通常、合計がゼロになる制約が課されます。

$\sum _{i}\alpha _{i}=\sum _{j}\beta _{j}=\sum _{i}\gamma _{ij}=\sum _{j}\gamma _{ij}=0$

これらの制約により、パラメータの重複が削除され、主効果と相互作用効果を適切に推定できるようになります。

バランスの取れた設計（すべてのグループまたは治療の組み合わせでサンプル数が等しい）では、各因子の値とそれらの相互作用は、各セルからの平均応答と全体の平均値を用いて推定できます。誤差が正規分布するという仮定の下では、これらの最小二乗法（LS）推定値は最尤推定値と同じです。^[3]

不均衡な設計（サンプルサイズが異なる）では、推定値はどの制約システムを使用するかによって異なります。C制約、UV制約、W制約など、不均等なグループサイズの扱い方が異なる重み付けシステムがいくつかあります。これらのうち、重みが各セルの観測値数に比例するW制約アプローチは、より明確で解釈しやすいパラメータ推定値を生み出し、直交性などの統計的特性を可能な限り維持するため、しばしば好まれます。^[3]

仮説検定

古典的な二元配置分散分析では、仮説検定を用いて、いずれかの因子、あるいはそれらの交互作用が従属変数に有意な影響を与えるかどうかを判定します。これは、データ全体の変動を平方和と呼ばれる以下の部分に分割することで行われます。

因子A（主効果）
因子B（主効果）
A x B相互作用
ランダム誤差（残差変動）

それぞれの二乗和は、そのソースによって説明されるデータの変動の量を表します。

これらの検定における帰無仮説は、各効果がゼロであると仮定する。つまり、いずれの要因もそれらの交互作用も結果に影響を与えない。対応する帰無仮説は以下の通りである。

$H_{0}^{(A)}:\alpha _{i}=0\ \forall i$
$H_{0}^{(B)}:\beta _{j}=0\ \forall j$
$H_{0}^{(AB)}:\gamma _{ij}=0\ \forall i,j$

標準的な手法では、まず交互作用項を検定することが推奨されています。交互作用が統計的に有意である場合、一方の因子の影響は他方の因子の水準に依存していることを示しており、解釈は各水準における単純な効果に焦点を当てるべきです。^[1]

交互作用項が有意でない場合は、2つの主効果を別々に検討するのが適切です。アンバランス型デザインでは、平方和の計算方法によって結果が若干異なる場合があります。最も一般的な3つのタイプは、タイプI（逐次型）、タイプII（階層型）、タイプIII（周辺型）です。ほとんどの統計ソフトウェアプログラムは、タイプIIIの平方和を使用しています。これは、モデル内の他のすべての因子について各検定を調整するため、結果の解釈が容易になるためです。^[3]^[8]

アンバランスなデザイン

二元配置分散分析はサンプルサイズが等しい場合に最も効果的ですが、実際の実験ではグループサイズが不均等であることが多く、結果として不均衡な設計となります。処理の組み合わせによって観測値の数が異なる場合、二元配置分散分析は直交性を失い、一方の因子によって説明される変動がもう一方の因子から完全に独立ではなくなります。^[3]これにより、各因子の影響を分離して解釈することが難しくなります。

このような場合には、次の 2 つのアプローチを適用できます。

一方の要因の影響をテストする前に、もう一方の要因の影響を排除する (調整効果)。
他の要因（調整されていない効果）を無視する。^[3]

これら2つの方法は、すべての水準でサンプルサイズが比例している場合にのみ同じ結果をもたらします。多くの場合、研究者は調整効果を用いて、各要因の検定が他方の要因によって既に説明されている変動を考慮に入れていることを確認します。^[3]

現代の統計ソフトウェア（例：R、SPSS、SAS ）はこのロジックを自動的に実装しますが、報告書ではどの種類の平方和が使用されたかを明確に指定することが重要です。バランス型または比例型の設計では、すべての種類の平方和で同一の結果が得られます。^[9]

例

以下の仮想データセットは、二元配置分散分析によって、総変動を2つの実験要因（肥料の種類と環境条件）によって説明される要素に分離する方法を示す簡単な例です。測定値は、肥料と環境条件の異なる組み合わせで収集された植物の収量を表しています。

	_余分なCO2	余分な湿度
肥料なし	7、2、1	7、6
硝酸塩	11、6	10、7、3
リン酸	5、3、4	11、4

これらの結果から、総変動（SS _Total ）は、各主要因の平方和、それらの交互作用、およびランダム誤差に分割されます。以下の分散分析要約表は、各要因に起因する変動の大きさを示しています。

変動の源	平方和	自由度	平均二乗
肥料	525.43	2	262.72
環境	519.27	1	519.27
肥料×環境	84.83	2	42.42
エラー	9.43	9	1.05
合計	1138.96	14	-

最後に、各効果のF 値は、因子の平均二乗を誤差の平均二乗で割ることによって計算されます。

$F_{A}={\frac {MS_{A}}{MS_{E}}},\quad F_{B}={\frac {MS_{B}}{MS_{E}}},\quad F_{A\times B}={\frac {MS_{A\times B}}{MS_{E}}}.$

交互作用項が有意である場合、肥料の種類と環境が複合的に収量に影響を与えていることを示しており、次のステップは各水準内での単純効果を比較することです。交互作用が有意でない場合は、2つの主効果を個別に解釈できます。このような解釈は、生物測定学および実験設計において標準的な方法です。^[1]^[9]

参照

注釈と引用文献

^ abcdefghi Kim, Hae-Young (2014-03-21). 「臨床研究者のための統計ノート：二元配置分散分析（ANOVA）-因子間の相互作用の可能性の検討」Restorative Dentistry & Endodontics . 39 (2): 143– 147. doi :10.5395/rde.2014.39.2.143. ISSN 2234-7658. PMC 3978106. PMID 24790929 .
^ abc Gelman, Andrew (2005年2月). 「分散分析？なぜこれまで以上に重要なのか」. The Annals of Statistics . 33 (1): 1– 53. arXiv : math/0504499 . doi :10.1214/009053604000001048. S2CID 125025956.
^ abcdefgh 藤越康則 (1993). 「不均衡データを用いた2元配置分散分析モデル」.離散数学. 116 (1): 315– 334. doi : 10.1016/0012-365X(93)90410-U .
^ ab フィッシャー、ロナルド・アイルマー (1954). 研究者のための統計手法（第12版、改訂版）エディンバラ：オリバー・アンド・ボイド。
^ イェーツ、フランク（1934年3月）「異なるクラスに不均等な人数がいる場合の多重分類の分析」アメリカ統計学会誌29 ( 185): 51– 66. doi :10.1080/01621459.1934.10502686. JSTOR 2278459.
^ abcde Kass, Robert E (2011年2月1日). 「統計的推論：全体像」.統計科学. 26 (1): 1– 9. arXiv : 1106.2895 . doi :10.1214/10-sts337. PMC 3153074. PMID 21841892 .
^ ゲルマン、アンドリュー、ヒル、ジェニファー（2006年12月18日）『回帰分析と階層型／多層モデルを用いたデータ分析』ケンブリッジ大学出版局、pp. 45– 46. ISBN 978-0521867061。
^ ムラリダール、カンチ (2008)。「心臓麻酔の指導」。心臓麻酔の実録。11 (2): 75.土井: 10.4103/0971-9784.41573。ISSN 0971-9784。PMID 18603745。
^ ab ベイリー, ケント; ソーカル, ロバート R.; ロルフ, F. ジェームズ (1982年12月). 「バイオメトリクス：生物学研究における統計の原理と実践（第2版）」 .アメリカ統計学会誌. 77 (380): 946. doi :10.2307/2287349. ISSN 0162-1459. JSTOR 2287349.

参考文献

[:1-1] Kim, Hae-Young (2014-03-21). 「臨床研究者のための統計ノート：二元配置分散分析（ANOVA）-因子間の相互作用の可能性の検討」Restorative Dentistry & Endodontics . 39 (2): 143– 147. doi :10.5395/rde.2014.39.2.143. ISSN 2234-7658. PMC 3978106. PMID 24790929 .

[:4-2] Gelman, Andrew (2005年2月). 「分散分析？なぜこれまで以上に重要なのか」. The Annals of Statistics . 33 (1): 1– 53. arXiv : math/0504499 . doi :10.1214/009053604000001048. S2CID 125025956.

[:0-3] 藤越康則 (1993). 「不均衡データを用いた2元配置分散分析モデル」.離散数学. 116 (1): 315– 334. doi : 10.1016/0012-365X(93)90410-U .

[:5-4] フィッシャー、ロナルド・アイルマー (1954). 研究者のための統計手法（第12版、改訂版）エディンバラ：オリバー・アンド・ボイド。

[5] イェーツ、フランク（1934年3月）「異なるクラスに不均等な人数がいる場合の多重分類の分析」アメリカ統計学会誌29 ( 185): 51– 66. doi :10.1080/01621459.1934.10502686. JSTOR 2278459.

[:3-6] Kass, Robert E (2011年2月1日). 「統計的推論：全体像」.統計科学. 26 (1): 1– 9. arXiv : 1106.2895 . doi :10.1214/10-sts337. PMC 3153074. PMID 21841892 .

[7] ゲルマン、アンドリュー、ヒル、ジェニファー（2006年12月18日）『回帰分析と階層型／多層モデルを用いたデータ分析』ケンブリッジ大学出版局、pp. 45– 46. ISBN 978-0521867061。

[8] ムラリダール、カンチ (2008)。「心臓麻酔の指導」。心臓麻酔の実録。11 (2): 75.土井: 10.4103/0971-9784.41573。ISSN 0971-9784。PMID 18603745。

[:2-9] ベイリー, ケント; ソーカル, ロバート R.; ロルフ, F. ジェームズ (1982年12月). 「バイオメトリクス：生物学研究における統計の原理と実践（第2版）」 .アメリカ統計学会誌. 77 (380): 946. doi :10.2307/2287349. ISSN 0162-1459. JSTOR 2287349.