関係スクエア

統計学において、関係四角形は、個人×変数の表の因子分析において用いられるグラフィカル表現である。この表現は、主成分分析(PCA)や多重対応分析(MCA)によって提供される古典的な表現、すなわち個人、量的変数(相関円)、そして質的変数のカテゴリー(それらを持つ個人の重心における)の表現を補完するものである。これは、混合データの因子分析(FAMD)および多因子分析(MFA)において特に重要である

の定義関係スクエアMCAフレーム内

関係四角形の第一の目的は、変数のカテゴリではなく、変数自体を表すことです。これは、変数の数が多いほど重要です。このため、質的変数ごとに、因子順位因子、は順位 の軸に沿った個体の座標のベクトルです。PCA では、は順位の主成分と呼ばれます)と変数の間の相関比の二乗を計算します。これは通常、次のように表されます。 したがって、各因子平面に、質的変数自体の表現を関連付けることができます。座標は 0 から 1 の間であり、変数は点 (0,0)、(0,1)、(1,0)、(1,1) を頂点とする四角形内に表示されます。 j {\displaystyle j} F s {\displaystyle F_{s}} F s {\displaystyle F_{s}} s {\displaystyle s} s {\displaystyle s} F s {\displaystyle F_{s}} s {\displaystyle s} F s {\displaystyle F_{s}} j {\displaystyle j} η 2 j F s {\displaystyle \eta ^{2}(j,F_{s})}

MCAの例

6 人の個人 ( )はそれぞれ 3、2、3 つのカテゴリを持つ3 つの変数によって記述されます。例: 個人はカテゴリを持ちます 1 6 {\displaystyle i_{1},\ldots ,i_{6})} q 1 q 2 q 3 {\displaystyle (q_{1},q_{2},q_{3})} 1 {\displaystyle i_{1}} 1つの {\displaystyle a} q 1 {\displaystyle q_{1}} d {\displaystyle d} q 2 {\displaystyle q_{2}} f {\displaystyle f} q 3 {\displaystyle q_{3}}

表 1. MCA の分データセット。
q 1 {\displaystyle q_{1}} q 2 {\displaystyle q_{2}} q 3 {\displaystyle q_{3}}
1 {\displaystyle i_{1}} q 1 {\displaystyle q_{1}} -あ q 2 {\displaystyle q_{2}} -d q 3 {\displaystyle q_{3}} -f
2 {\displaystyle i_{2}} q 1 {\displaystyle q_{1}} -b q 2 {\displaystyle q_{2}} -d q 3 {\displaystyle q_{3}} -f
3 {\displaystyle i_{3}} q 1 {\displaystyle q_{1}} -c q 2 {\displaystyle q_{2}} -d q 3 {\displaystyle q_{3}} -g
4 {\displaystyle i_{4}} q 1 {\displaystyle q_{1}} -あ q 2 {\displaystyle q_{2}} -e q 3 {\displaystyle q_{3}} -g
5 {\displaystyle i_{5}} q 1 {\displaystyle q_{1}} -b q 2 {\displaystyle q_{2}} -e q 3 {\displaystyle q_{3}} -h
6 {\displaystyle i_{6}} q 1 {\displaystyle q_{1}} -c q 2 {\displaystyle q_{2}} -e q 3 {\displaystyle q_{3}} -h

これらのデータに適用すると、R パッケージ FactoMineR に含まれる MCA 関数は、図 1 の古典的なグラフを提供します。

図1. FactoMineRによる表1のMCA。個体(青)とカテゴリ(変数に応じた色)の表現。
図2. FactoMineRによる表1のMCA。関係性の四角形。

関係を示す四角形(図2)は、古典的な因子平面の読み取りを容易にします。これは以下のことを示しています。

  • 最初の要因は 3 つの変数に関連していますが、特に(最初の軸に沿って非常に高い座標を持つ)と に関連しています q 3 {\displaystyle q_{3}} q 2 {\displaystyle q_{2}}
  • 2 番目の因子は、 と にのみ関連し2 に沿った座標が 0 に等しい とは関連しない)、その関係は強く、等しくなっています。 q 1 {\displaystyle q_{1}} q 3 {\displaystyle q_{3}} q 2 {\displaystyle q_{2}}

これらはすべて従来のグラフにも見られますが、それほど明確ではありません。関係を示す四角形の役割は、まず従来のグラフの読みやすさを向上させることです。これは、変数の数が多く、座標も多数ある場合に非常に役立ちます。

拡張機能

この表現は量的変数の表現で補完することができ、後者の座標は相関係数の二乗(相関比の二乗ではない)となる。したがって、関係二乗の二つ目の利点は、量的変数と質的変数を同時に表現できることにある。[1]

関係性四角形は、個人x変数の表の任意の因子分析から構築できます。特に、体系的に使用される(または使用されるべきです):

  • 多重コレスポンデンス分析(MCA)において[2]
  • 補助変数が多数ある場合の主成分分析 (PCA) では、
  • 混合データの因子分析(FAMD)において。

このグラフを変数のグループに拡張したもの(変数のグループを単一のポイントでどのように表現するか?)は、多因子分析(MFA)で使用されます。

歴史

質的変数自体を(カテゴリーではなく)点で表すというアイデアは、ブリジット・エスコフィエによるものである。[3]現在使用されているグラフは、ブリジット・エスコフィエとジェローム・パジェスが多因子分析の枠組みの中で導入したものである[4]。

結論

MCAでは、関係性四角形は混合変数間の関係性を総合的に表します。これは、多くの変数が多くのカテゴリを持つ場合、特に有用です。この表現は、多数の混合変数(有効変数と補助変数の両方を含む)が存在する場合のあらゆる因子分析において有用です。

参考文献

  1. ^ 2種類の変数を用いた例は、Pagès Jérôme (2014). Multiple Factor Analysis by Example Using R . Chapman & Hall/CRC The R Series London 272 pに掲載されています。
  2. ^ Husson F., Lê S. & Pagès J. (2009). R. Chapman & Hall/CRC The R Seriesを用いた例による探索的多変量解析, ロンドン. ISBN 978-2-7535-0938-2
  3. ^ エスコフィエ・ブリジット (1979)。変数の表現と対応関係の倍数の分析を行う必要はありません。Revue de statistique アップリケ。巻。 XXVII、番号 4、37 ~ 47 ページ。 http://archive.numdam.org/ARCHIVE/RSA/RSA_1979__27_4/RSA_1979__27_4_37_0/RSA_1979__27_4_37_0.pdf
  4. ^ Escofier B. & Pagès J. (1988 第 1 版、2008 第 4 版)単因数と倍数の因数分解を分析。目的、方法、解釈。デュノー、パリ、318 p ISBN 978-2-10-051932-3
  • 探索的データ分析に特化した FactoMineR AR ソフトウェア。
「https://en.wikipedia.org/w/index.php?title=Relationship_square&oldid=1314635435」より取得