統計学において、ベーレンス・フィッシャー分布(ベーレンス・フィッシャーぶんさん、英: Behrens-Fisher distribution)は、ロナルド・フィッシャーとウォルター・ベーレンスにちなんで名付けられた、ベーレンス・フィッシャー問題の解から生じる、パラメータ化された確率分布族である。ベーレンス・フィッシャー問題とは、正規分布に従う2つの母集団の分散比が不明な場合(特に、分散が等しいことが不明な場合)の、母集団の平均の差に関する統計的推論の問題である。 [ 1 ]
定義
ベーレンス・フィッシャー分布は、次の形の 確率変数の分布です

ここで、T 1とT 2はそれぞれスチューデントのt分布に従う独立確率変数であり、自由度はそれぞれν 1 = n 1 − 1 とν 2 = n 2 − 1 であり、θは定数である。したがって、ベーレンス・フィッシャー分布族はν 1、 ν 2、および θによってパラメータ化される。
導出
2つの母分散が等しいことが分かっており、2つの母集団から n⁻¹とn⁻²の標本が採取されると仮定します
![{\displaystyle {\begin{aligned}X_{1,1},\ldots ,X_{1,n_{1}}&\sim \operatorname {iid} N(\mu _{1},\sigma ^{2}),\\[6pt]X_{2,1},\ldots ,X_{2,n_{2}}&\sim \operatorname {iid} N(\mu _{2},\sigma ^{2}).\end{aligned}}}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
ここで「iid」は独立かつ同一分布に従う確率変数であり、Nは正規分布を表す。2つの標本平均は
![{\displaystyle {\begin{aligned}{\bar {X}}_{1}&=(X_{1,1}+\cdots +X_{1,n_{1}})/n_{1}\\[6pt]{\bar {X}}_{2}&=(X_{2,1}+\cdots +X_{2,n_{2}})/n_{2}\end{aligned}}}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
通常の「プールされた」共通分散σ 2の不偏推定値は、

ここで、S 1 2とS 2 2は、2つの母分散の 通常の不偏(ベッセル補正)推定値です。
これらの仮定の下では、重要な量は

は自由度n 1 + n 2 − 2のt分布に従う。 したがって、端点が

ここで、Aはt分布の適切な分位数です。
しかし、ベーレンス・フィッシャー問題では、2つの母分散が等しいとは限らず、またその比率も分かっていない。フィッシャーは、重要な量を

これは次のように書ける。

ここで

は通常の1標本t統計量であり、

θは第1象限にあると します。代数的な詳細は次のとおりです
![{\displaystyle {\begin{aligned}{\frac {(\mu _{2}-\mu _{1})-({\bar {X}}_{2}-{\bar {X}}_{1})}{\displaystyle {\sqrt {{\frac {S_{1}^{2}}{n_{1}}}+{\frac {S_{2}^{2}}{n_{2}}}}}}}&={\frac {\mu _{2}-{\bar {X}}_{2}}{\displaystyle {\sqrt {{\frac {S_{1}^{2}}{n_{1}}}+{\frac {S_{2}^{2}}{n_{2}}}}}}}}-{\frac {\mu _{1}-{\bar {X}}_{1}}{\displaystyle {\sqrt {{\frac {S_{1}^{2}}{n_{1}}}+{\frac {S_{2}^{2}}{n_{2}}}}}}}\\[10pt]&=\underbrace {\frac {\mu _{2}-{\bar {X}}_{2}}{S_{2}/{\sqrt {n_{2}}}}} _{{\text{これは }}T_{2}}\cdot \underbrace {\left({\frac {S_{2}/{\sqrt {n_{2}}}}{\displaystyle {\sqrt {{\frac {S_{1}^{2}}{n_{1}}}+{\frac {S_{2}^{2}}{n_{2}}}}}}}}\right)} _{{\text{これは }}\cos \theta }-\underbrace {\frac {\mu _{1}-{\bar {X}}_{1}}{S_{1}/{\sqrt {n_{1}}}}} _{{\text{これは }}T_{1}}\cdot \underbrace {\left({\frac {S_{1}/{\sqrt {n_{1}}}}{\displaystyle {\sqrt {{\frac {S_{1}^{2}}{n_{1}}}+{\frac {S_{2}^{2}}{n_{2}}}}}}}}\right)} _{{\text{これは }}\sin \theta }.\qquad \qquad \qquad (1)\end{aligned}}}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
上記の括弧内の式の平方の合計が 1 であるという事実は、それらがある角度の二乗余弦と二乗正弦であることを意味します。
ベーレン・フィッシャー分布は、実際には、cos θとsin θというラベルの付いた量の値 が与えられた場合の、上記量(1)の条件付き分布です。実質的には、補助情報に対するフィッシャー条件です。
フィッシャーはその後、端点が

ここで、Aはベーレンス・フィッシャー分布の適切なパーセンテージポイントです。フィッシャーは、データ(最終的にはX )が与えられた場合に、 μ 2 − μ 1がこの区間に含まれる確率は、ベーレンス・フィッシャー分布に従う確率変数が − Aと Aの間にある確率であると主張しました。
フィデューシャル区間と信頼区間
バートレットは、この「信頼区間」は一定の被覆率を持たないため、信頼区間ではないことを示しました。フィッシャーは、これを信頼区間の使用に対する説得力のある反論とは考えませんでした。
さらに詳しい参考文献
参考文献