焦点情報基準

統計学において、焦点を絞った情報量基準 (FIC)は、与えられたデータ セットに対して、一連の競合モデルの中から最も適切なモデルを選択する方法です。赤池情報量基準(AIC)、ベイズ情報量基準(BIC) 、逸脱情報量基準(DIC) などの他のほとんどのモデル選択戦略とは異なり、FIC は候補モデルの全体的な適合性を評価しようとはせず、統計分析を用いて主要な関心事のパラメータ ( とします) に直接注目します。競合するモデルでは、モデルに対して、たとえば異なる推定値が得られます。FIC 法では、まず、に対して、たとえば各推定値の精度または品質の正確な式または近似式を作成し、次にデータを使用してこれらの精度指標 ( とします) を推定します。最終的に、推定精度が最も高いモデルが選択されます。 FIC 方法論は、Gerda ClaeskensNils Lid Hjortによって、2003 年に Journal of the American Statistical Associationに発表された 2 つの議論記事で最初に開発され、その後、他の論文や 2008 年の著書で発表されました。 μ{\displaystyle \mu}μ^j{\displaystyle {\hat {\mu }}_{j}}j{\displaystyle j}rj{\displaystyle r_{j}}μ^j{\displaystyle {\hat {\mu }}_{j}}r^j{\displaystyle {\hat {r}}_{j}}

FIC の具体的な公式と実装は、まず対象となる特定のパラメータに依存します。その選択は、数学ではなく、科学的および統計的な文脈に依存します。したがって、FIC 装置では、分布の分位数を推定するのに最適なモデルが選択されますが、平均値を推定するには別のモデルが最適とされる場合があります。次に、FIC の公式は、観測データに使用されるモデルの詳細と、精度の測定方法に依存します。最も明確なケースは、精度が平均二乗誤差される場合で、たとえば、モデルに関連付けられた推定量の二乗バイアスと分散の観点から考えられます。FIC の公式は、さまざまな状況で使用でき、二乗バイアス分散を個別に推定して、推定精度 を導きます。最終的に、FIC は推定平均二乗誤差が最小のモデルを選択します。 rjbj2+τj2{\displaystyle r_{j}=b_{j}^{2}+\tau _{j}^{2}}j{\displaystyle j}r^j{\displaystyle {\hat {r}}_{j}}

FICを用いて適切なモデルを選択する際に用いられるのが、FICプロットです。これは、すべての候補モデルにおけるすべての推定値とそのメリットを明確かつ分かりやすく示すように設計されています。プロットの軸には推定値とFICスコアが表示されます。つまり、プロットの左側にある推定値はより優れたモデルに関連し、中央と右側にある推定値は、対象とする焦点パラメータを推定する目的には適さない、あるいはそれほど適切ではないモデルに由来するものです。 y{\displaystyle y}×{\displaystyle x}

一般的に、複雑なモデル(サンプルサイズに対して多くのパラメータを持つ)は、バイアスが小さいものの分散が大きい推定値を生成する傾向があります。一方、より簡素なモデル(パラメータが少ない)は、一般的にバイアスが大きく分散が小さい推定値を生成します。FIC法は、バイアスと分散が小さいという2つの望ましいデータを最適にバランスさせます。主な難しさはバイアスにあります。これは、推定値の期待値から推定対象となる真の基礎量までの距離に関係し、真のデータ生成メカニズムが各候補モデルの外部に存在する可能性があるためです。 bj{\displaystyle b_{j}}

固有のフォーカス パラメータがなく、むしろそのようなパラメータのファミリーが存在する状況では、適切に重み付けされたパフォーマンス測定の観点から最適なモデルを見つける平均 FIC (AFIC または wFIC) のバージョンがあります。たとえば、共変量空間 の一部で特に優れたパフォーマンスを発揮する回帰モデルを検索する場合などです。

最良のモデルをいくつか残し、最良のFICスコアの推定値についてデータに基づいた加重平均で統計分析を終了することも可能であり、通常は最良のFICスコアに関連する推定値に最大の重み付けを与える。このようなモデル平均化の手法は、直接FIC選択法を拡張するものである。

FIC 方法論は、一般化線形モデルのフレームワークやセミパラメトリック比例ハザードモデル(Cox 回帰) など、さまざまな形式の回帰分析における変数の選択に特に適用されます。

参照

参考文献