

構造方程式モデリング(SEM)は、科学者が観察研究と実験研究の両方において用いる多様な手法群です。SEMは主に社会科学および行動科学の分野で用いられますが、疫学[ 2 ]、[ 3 ]などの分野でも用いられています。標準的な定義によれば、SEMとは「観測データの平均、分散、共分散に関する仮説を、仮説に基づく概念モデルまたは理論モデルによって定義される少数の「構造的」パラメータを用いて表現しようとする手法群」です。[ 4 ]
SEMは、ある現象の様々な側面がどのように因果的に相互に関連していると考えられるかを表すモデルを用いる。構造方程式モデルには、潜在変数(存在すると考えられるが直接観察できない変数)間の因果関係が仮定されていることが多い。追加の因果関係は、これらの潜在変数を、データセットに値として現れる観測変数に結び付ける。因果関係は方程式を用いて表現されるが、図1や図2のように矢印を含む図を用いて仮定された構造を示すこともできる。因果構造は、観測変数の値に特定のパターンが現れるはずであることを示唆している。これにより、観測変数の値間の関係を用いて、仮定された効果の大きさを推定し、観測データが仮定された因果構造の要件と一致するかどうかを検定することが可能になる。[ 5 ]
構造方程式モデルであるかどうかの境界は必ずしも明確ではありませんが、SEモデルには、潜在変数(態度、知性、精神疾患など、存在すると考えられるが直接観察できない変数)のセット間の仮定された因果関係と、仮定された潜在変数を、観察可能で何らかのデータセットで値が利用可能な変数に結び付ける因果関係が含まれることがよくあります。潜在的な因果関係のスタイルのバリエーション、潜在変数を測定する観測変数のバリエーション、および統計的推定戦略のバリエーションにより、SEMツールキットには、確証的因子分析(CFA)、確証的複合分析、パス分析、マルチグループモデリング、縦断的モデリング、部分最小二乗パスモデリング、潜在成長モデリング、階層的またはマルチレベルモデリングが含まれます。[ 6 ] [ 7 ] [ 8 ] [ 9 ] [ 10 ]
SEM研究者は、モデル化された構造的接続に対応する係数の強度と符号(例えば、図1の矢印に接続された数値)を推定するためにコンピュータプログラムを使用します。図1のような仮定モデルは、観測データの測定を制御する現実世界の力に対応しない可能性があるため、プログラムはモデルテストと診断の手がかりも提供し、どの指標またはどのモデル構成要素がモデルと観測データの間に不整合をもたらす可能性があるかを示唆します。SEM手法に対する批判としては、利用可能なモデルテストの無視、モデルの仕様に関する問題、外部妥当性を考慮せずにモデルを受け入れる傾向、潜在的な哲学的バイアスなどが挙げられます。[ 11 ]
SEMの大きな利点は、これらの測定と検定がすべて一つの統計的推定手順の中で同時に行われ、観測変数からのすべての情報を用いてすべてのモデル係数が計算されることです。つまり、研究者がモデルの各部分を個別に計算する場合よりも、推定値の精度が向上します。[ 12 ]
構造方程式モデリング(SEM)は、Sewall Wrightが、観測変数間の直接的および間接的な効果を生み出す物理的および生理学的メカニズムをしっかりと理解し、一連の回帰スタイルの方程式に明示的な因果解釈を与えたことで、相関や回帰との差別化が始まりました。[ 13 ] [ 14 ] [ 15 ]これらの方程式は通常の回帰方程式のように推定されましたが、測定された変数の実質的なコンテキストにより、予測だけでなく明確な因果関係の理解が可能になりました。OD Duncanは1975年の著書でSEMを社会科学に紹介し、[ 16 ]計算能力の向上により実用的なモデル推定が可能になった1970年代後半から1980年代にかけてSEMが開花しました。1987年にはHayduk [ 7 ]が潜在変数を含む構造方程式モデリングの入門書を初めて出版し、その後すぐにBollenの人気テキスト(1989年)が続きました。[ 17 ]
心理学、社会学、経済学では、それぞれ異なるが数学的に関連性のあるモデリング手法が開発された。コウルズ委員会による初期の同時方程式推定に関する研究は、クープマンとフッド(1953)の輸送経済学と最適経路に関するアルゴリズムを中心に、最大尤度推定と閉形式の代数計算が用いられた。これは、コンピュータが登場する前の時代には反復的な解の探索手法には限界があったためである。これらの 2 つの発展の流れ(心理学からの因子分析と、ダンカンを経由した社会学からのパス分析)が収束して、現在の SEM の中核が生まれた。カール・イェレスコグが教育試験サービスで開発したいくつかのプログラムのうちの 1 つである LISREL [ 18 ] [ 19 ] [ 20 ]は、潜在変数(心理学者は因子分析から潜在因子として知っていた)をパス分析形式の方程式(社会学者はライトとダンカンから受け継いだ)に埋め込んだ。モデルの因子構造部分には測定誤差が組み込まれており、異なる仮定された潜在変数を結び付ける効果の、必ずしも誤差のない推定ではないものの、測定誤差の調整が可能になっています。
因子分析とパス分析の伝統が歴史的に収束した痕跡は、モデルの測定部分と構造部分の区別、そしてモデル検定、そして測定を構造推定に先行させるべきか同時進行させるべきかをめぐる継続的な意見の相違として残っている。[ 21 ] [ 22 ]因子分析をデータ削減手法と見なすと検定の重要性が軽視されるが、これはパス分析が仮定された因果関係の検定を重視していることとは対照的である。この場合、検定結果はモデルの誤指定を示唆する可能性がある。因子分析とパス分析の伝統間の摩擦は、文献において依然として表面化している。
ライトのパス解析はヘルマン・ウォルド、ウォルドの弟子カール・イェレスコグ、イェレスコグの弟子クラーエス・フォルネルに影響を与えたが、SEMはモデリングの目的と典型的なデータ構造における根本的な違いのためか、米国の計量経済学者の間で大きな支持を得ることはなかった。SEMの経済部門が長期間分離されていたため、手続き上や用語上の違いが生じているが、数学的および統計的な深いつながりは残っている。[ 23 ] [ 24 ]分野によるアプローチの違いは、SEMNETの内生性に関する議論や、有向非巡回グラフ(DAG)による因果関係に関する議論に見ることができる。[ 5 ]さまざまなSEMアプローチを比較対照する議論は利用可能であり[ 25 ] [ 26 ]、データ構造における分野の違いと経済モデルの動機となる懸念を強調している。
ジュデア・パール[ 5 ]はSEMを線形モデルからノンパラメトリックモデルへと拡張し、方程式の因果的解釈と反事実的解釈を提案した。ノンパラメトリックSEMは、効果の線形性や誤差項の分布に関する仮定を一切必要とせずに、総効果、直接効果、間接効果を推定することを可能にする。[ 26 ]
SEM分析は、複雑な概念を分解し因果関係を理解するのに役立つため、社会科学で人気がありますが、モデルの複雑さにより、従来の制御変数の有無、サンプルサイズ、関心のある変数に応じて結果に大きなばらつきが生じる可能性があります。[ 27 ]実験設計の使用により、これらの疑問の一部に対処できる可能性があります。[ 28 ]
今日、SEMは機械学習と(解釈可能な)ニューラルネットワークの基盤の一部を形成しています。古典統計における探索的因子分析と検証的因子分析は、教師なし機械学習と教師あり機械学習を反映しています。
以下の考慮事項は、多くの構造方程式モデルの構築と評価に適用されます。
モデルを構築または指定するには、次の点に注意する必要があります。
構造方程式モデルは、因果的に均質な事例、すなわち、同じ因果構造に絡み合っているものの、原因変数の値が異なり、したがって結果変数の値も異なる事例に作用する世俗的な力を反映させようとします。因果的均質性は、事例選択、あるいは多群モデルにおける事例の分離によって促進されます。モデルの仕様は、研究者が以下の事項を規定するまでは完成しません。
モデルの潜在レベルは、内生変数と外生変数で構成されます。内生潜在変数は、少なくとも 1 つの他のモデル化された変数から効果を受けると想定される真のスコア変数です。各内生変数は、回帰スタイルの方程式で従属変数としてモデル化されます。外生潜在変数は、1 つ以上の内生変数を引き起こすと想定される背景変数であり、回帰スタイルの方程式の予測変数のようにモデル化されます。外生変数間の因果関係は明示的にモデル化されませんが、通常は外生変数が互いに自由に相関するものとしてモデル化することで認識されます。モデルには、介在変数 (一部の変数から効果を受けるだけでなく、他の変数にも効果を送る変数) が含まれる場合があります。回帰と同様に、各内生変数には、利用できない通常は未知の原因の効果をカプセル化する残差変数または誤差変数が割り当てられます。外生的か内生的かを問わず、各潜在変数はその変数に関する事例の真のスコアを含んでいると考えられており、これらの真のスコアは、観察/報告された指標変数の1つ以上に有効な/真の変動を因果的に寄与する。[ 29 ]
LISRELプログラムは、様々なモデル構成要素を追跡するために、一連の行列の要素にギリシャ語名を割り当てました。これらの名前は比較的標準的な表記法となりましたが、様々な統計的考慮に対応するために表記法は拡張・変更されてきました。[ 20 ] [ 7 ] [ 17 ] [ 30 ] 図やユーザーが選択した変数名を許容する方程式を用いてモデル仕様を「簡略化」するテキストやプログラムは、バックグラウンドでユーザーのモデルを標準的な行列代数形式に再変換します。この「簡略化」は、ユーザーが意識する必要のないモデルの特徴に関するデフォルトの「仮定」をプログラムに暗黙的に導入することによって実現されます。残念ながら、これらのデフォルトの仮定はモデル構成要素を容易に隠蔽し、モデルの構造や基礎となる行列に潜む認識されていない問題を残します。
SEMでは、モデルの2つの主要な構成要素が区別されます。1つは内生的および外生的潜在変数間の潜在的な因果関係を示す構造モデル、もう1つは潜在変数と指標間の因果関係を示す測定モデルです。例えば、探索的因子分析モデルと検証的因子分析モデルは因果関係のある測定関係に焦点を当てていますが、パスモデルはSEMの潜在的な構造的関係により近いものです。
モデラーは、モデル内の各係数を自由に推定するか、ある値に固定するかを指定します。自由係数は、研究者がテストしたい仮定効果、外生変数間の背景相関、または内生潜在変数に追加の変動をもたらす残差変数または誤差変数の分散です。固定係数は、図 2 の 1.0 のような潜在変数の尺度となる値、または因果関係の断絶を主張する 0.0 のような値です。例えば、図 1 の学業成績から 4 つの尺度のいずれかに直接的な影響がない (矢印がない) という主張などです。SEM プログラムは自由係数の推定値と検定を提供しますが、固定係数はモデル構造全体の検定に大きく貢献します。係数間のさまざまな種類の制約も使用できます。[ 30 ] [ 7 ] [ 17 ]モデルの仕様は、文献から知られていること、モデル化された指標変数に関する研究者の経験、および特定のモデル構造を使用して調査されている特徴によって異なります。
モデルで推定できる係数の数には限界があります。推定された係数の数よりもデータ点数が少ない場合、結果として得られるモデルは「未同定」とみなされ、係数推定値を得ることができません。また、相互作用やその他の因果ループも推定を妨げる可能性があります。[ 31 ] [ 32 ] [ 30 ]
0.0、1.0、またはその他の値に固定されたモデル係数は、既に指定された値を持っているため、推定の必要はありません。自由モデル係数の推定値は、自由モデル係数が推定値を採用した場合のデータの特徴と比較して、データへの適合を最大化するか、データとの差異を最小化することによって得られます。特定の係数値セットに対してデータがどのようになるかについてのモデルの影響は、次の要素によって決まります。a) モデル内の係数の位置 (どの変数が接続されているか、接続されていないかなど)、b) 変数間の接続の性質 (共分散または効果。効果は多くの場合線形であると想定されます)、c) 誤差または残差変数の性質 (多くの場合、多くの変数から独立しているか、因果的に接続されていないと想定されます)、および d) 変数に適した測定尺度 (多くの場合、区間レベル測定であると想定されます)。
2 つの潜在変数を結ぶ効果が強いということは、それらの潜在変数の指標の相関がより強いことを意味します。したがって、潜在変数の効果の妥当な推定値は、対応する潜在変数の指標間の相関に最も一致する値、つまりデータとの一致を最大化するか、データとの差異を最小化する推定値になります。最尤推定では、すべての自由モデル係数の数値が、サンプルデータ(データが変数の共分散/相関であるか、指標変数におけるケースの実際の値であるかに関係なく)を観測する尤度が最大化されるまで個別に調整されます(初期の開始値から徐々に増加または減少します)。通常の最小二乗推定値は、データと、モデルが正しく指定された場合、つまりモデルの推定されたすべての特徴が現実世界の特徴に対応する場合のデータとの間の二乗差異を最小化する係数値です。
推定値を得るために最大化または最小化すべき適切な統計特性は、変数の測定水準(一般的に、名義尺度や順序尺度よりも区間尺度の方が推定が容易である)と、特定の変数がモデル内のどこに現れるか(例えば、内生二値変数は外生二値変数よりも推定を困難にする)によって異なる。ほとんどのSEMプログラムは、モデルの係数を推定するために何を最大化または最小化するかについて、複数のオプションを提供している。選択肢としては、最尤推定法(MLE)、完全情報最大尤度法(FIML)、通常最小二乗法(OLS)、重み付き最小二乗法(WLS)、対角重み付き最小二乗法(DWLS)、2段階最小二乗法などが挙げられる。[ 30 ]
よくある問題の一つは、係数の推定値がモデルとデータによって十分に制約されていないために、識別が不十分になる可能性があることである。モデルとデータが一緒になって係数の値を十分に制約または制限しない限り、唯一の最良の推定値は存在しない。例えば、2つの変数間の単一のデータ相関の大きさは、それらの変数間のモデル化された効果の相互ペアの推定値を提供するには不十分である。相関は、相互効果の一方が他方の効果よりも強いこと、もう一方の効果が一方よりも強いこと、または効果が等しいことなどによって説明される可能性がある。識別が不十分な効果の推定値は、追加のモデル制約やデータ制約を導入することで識別可能にすることができる。例えば、一方の効果推定値をもう一方の効果推定値の2倍、3倍、または同等に制約することで、相互効果を識別可能にすることができるが[ 32 ]、結果として得られる推定値は、追加のモデル制約が世界の構造に対応している場合にのみ信頼できるものとなる。相互に因果関係にある2つの変数のうち、一方のみを直接引き起こす3つ目の変数のデータも、識別に役立つ。[ 31 ] 3つ目の変数が相互に因果関係にある変数の一方を直接引き起こさないように制約すると、相互効果の推定を悩ませる対称性が崩れる。なぜなら、3つ目の変数は、それが直接引き起こす変数と、間接的にしか影響を与えない逆効果の「もう一方の」端にある変数との相関よりも、より強く相関している必要があるからである。[ 31 ] ここでも、モデルの因果関係の規定が適切であることを前提としている点に注意されたい。つまり、3つ目の変数から相互効果のこちら側の端にある変数に直接的な効果が実際に存在し、相互に関係する2つの変数の「もう一方の端」にある変数には直接的な効果がない、ということである。ヌル/ゼロ効果に対する理論的な要求は、推定を支援する有用な制約となるが、理論はどの効果が存在しないとされているかを明確に報告できないことが多い。
この記事は、要約スタイルを用いることで短縮できる可能性があります。 |
モデル評価は、理論、データ、モデル、そして推定戦略に依存します。したがって、モデル評価では以下の点を考慮します。
理論を検証または「調査する」と主張する研究では、偶然を超えたモデルとデータの不整合に注意を払う必要があります。推定は、モデルの自由係数を調整し、データへの最適な適合度を提供します。SEMプログラムの出力には、推定されたモデル効果が実際に観測変数の値を制御した場合の観測変数間の関係を示す行列が含まれます。モデルの「適合度」は、モデルが示唆する関係(多くの場合、共分散)と、それに対応する観測変数間の関係との間の一致または不一致を報告します。データとモデルの含意の間に大きな有意差がある場合は、問題があることを示しています。χ 2 検定に伴う確率は、推定モデルが真の母集団の根底にある力を構成する場合、ランダムサンプリングの変動によってデータが生じる確率です。χ 2確率が小さい場合、モデル化された構造が真の母集団の因果力を構成した場合、現在のデータが生じる可能性は低いことが示され、残りの差はランダムサンプリングの変動に起因するとされます。
最適な係数推定値を選択したにもかかわらず、モデルがデータと依然として矛盾する場合、誠実な研究対応は、この証拠(多くの場合、有意なモデルχ2検定)を報告し、それに対処する。 [ 33 ]偶然を 超えたモデルとデータの不整合は、不整合の原因が問題のあるデータ、不適切な統計的推定値、あるいは不正確なモデル仕様のいずれであるかに関わらず、係数推定値とモデルの構造を判断するモデル能力の両方に疑問を投げかける。データと矛盾する(「失敗する」)モデルの係数推定値は、利用可能なデータと矛盾するモデルを信じる人にとって世界がどのように見えるかを示すものとして解釈可能である。データと矛盾するモデルの推定値は、統計的に奇妙になったり、理論に従って誤った符号が付けられたりすることによって、必ずしも「明らかに間違っている」とはならない。推定値は理論の要件にほぼ一致することさえあるが、依然として残るデータの不整合は、推定値と理論の一致が救済策を提供できないようにする。失敗したモデルは解釈可能ですが、それは利用可能な証拠と矛盾する解釈のみです。
複製では、データに不適切に適合するモデルの誤指定を検出することはほとんど不可能です。複製データが元のデータからランダムな変動の範囲内にある場合、元のデータに不適切に適合したのと同じ係数の誤った配置が、複製データにも不適切に適合する可能性があります。複製は、データミス(異なる研究グループによるもの)などの問題を検出するのに役立ちますが、探索的モデル修正後の誤指定を検出することは特に困難です。例えば、前半のデータに対して探索的因子分析(EFA)を行った後、ランダムに抽出した後半のデータに対して検証的因子分析を適用する場合などです。
修正指数とは、現在固定されている特定のモデル係数を推定のために解放した場合に、モデルのデータへの適合度がどの程度「改善」されるか(ただし、必ずしもモデルの構造がどの程度改善されるかとは限らない)を推定する指標です。データと整合しないモデルに直面した研究者は、修正指数によって適合度が大幅に改善される可能性が高いと報告された係数を簡単に解放することができます。これは同時に、因果的に誤っていて失敗するモデルから、因果的に誤っているが適合するモデルに移行するという大きなリスクをもたらします。なぜなら、データ適合度の向上は、解放された係数が実質的に妥当であるか、あるいは世界に適合しているという保証を与えないからです。元のモデルには、誤った方向の効果や、利用できない変数に関する誤った仮定など、因果関係の誤った指定が含まれている可能性があり、このような問題は現在のモデルに係数を追加しても修正できません。その結果、係数を追加することで適合度が向上したにもかかわらず、そのようなモデルは誤った指定のままとなります。適合はしているものの、世界的に矛盾するモデルは、特定のモデル(例えば、望ましい因子数を持つ因子モデル)に固執する研究者が、当初は適合しなかったモデルを修正指標によって「示唆される」測定誤差共分散を挿入することで適合させようとする場合に特に生じやすい。MacCallum (1986) は、「好ましい条件下でも、仕様化サーチャーから生じるモデルは慎重に検討する必要がある」ことを実証した。[ 34 ]モデルの誤仕様化は、修正指標によって示唆される係数を挿入することで修正できる場合もあるが、類似しているものの重要な点で異なる潜在変数を示す指標をいくつか用いることで、より多くの修正の可能性が生まれる。[ 35 ]
不合格モデルを「十分に近い」ものとして「受け入れる」ことも、合理的な選択肢ではない。ブラウン、マッカラム、キム、アンダーソン、グレイザーは、χ 2検定が(必ずしもそうとは限らないものの)モデルの誤指定を検出する上でかなりの力を持つ理由の背後にある数学的根拠について警告的な例を示した。[ 36 ] χ 2検定に伴う確率とは、現在のモデルが最適な推定値を用いて真の母集団の根底にある力を構成する場合、ランダムサンプリングの変動によってデータが生じる確率である。小さなχ 2確率は、現在のモデル構造が真の母集団の因果力を構成した場合、現在のデータが生じる可能性は低いことを示しており、残りの差異はランダムサンプリングの変動に起因するとされている。ブラウン、マッカラム、キム、アンダーセン、グレイザーは、 χ 2によればモデルがデータと有意に矛盾しているにもかかわらず、許容できるとみなした因子モデルを提示した。適合度が近ければ十分であるとする彼らの主張の誤りは、Hayduk、Pazkerka-Robinson、Cummings、Levers、Beres [ 37 ]によって 実証された。彼らは、Browneらが見落としていた実験的特徴を組み込むことで、Browneら自身のデータに適合するモデルを示した。その誤りは指標の計算やχ2検定の過敏性にあったのではない。Browne、MacCallum、そして他の著者らが、不適合度の程度がモデルの仕様における問題の性質、場所、あるいは深刻度と一致するとは信頼できないことを忘れたり、無視したり、あるいは見落としたりしたことに誤りがあった。[ 38 ]
多くの研究者は、サンプルサイズ (N) の増加とともにχ 2が増加する (したがって χ 2確率が減少する) と主張して、モデルをテストするのではなく適合指標に切り替えることを正当化しようとしました。この根拠でχ 2 を軽視することには 2 つの間違いがあります。第 1 に、適切なモデルの場合、 χ 2 はN の増加とともに増加しません[ 33 ]。したがって、 χ 2 がN とともに増加する場合、それ自体が何かが検出可能な問題があることを示しています。第 2 に、検出可能なほど誤って指定されたモデルの場合、 N とともにχ 2 が増加すると、モデルの誤った指定を検出する統計的検出力 (つまり、第 2 種の誤りを検出する力) が向上するという朗報があります。重要な誤った指定のいくつかの種類はχ 2では検出できません[ 38 ]。したがって、ランダムな変動によって合理的に生成される可能性のある量を超える不適合は、報告および検討に値します。[ 39 ] [ 33 ] χ2モデル検定は調整可能であり、[ 40 ]最も強力な利用可能な構造方程式モデル検定である。
数多くの適合指標は、モデルがデータにどれだけ適合しているかを定量化しますが、すべての適合指標には、不適合のサイズや量が、データの不整合を生み出している問題の重大性や性質と確実に調整されていないという論理的な困難があります。[ 38 ] 因果構造が異なっていても、データにまったく同じように適合するモデルは、等価モデルと呼ばれています。[ 30 ]このようなモデルは、因果的には等価ではありませんが、データ適合は等価です。そのため、いわゆる等価モデルの少なくとも 1 つは、世界の構造と矛盾している必要があります。X と Y の間に完全な 1.0 の相関関係があり、これを X が Y を引き起こすとモデル化すると、完全な適合とゼロ残差誤差が得られます。しかし、Y が実際に X を引き起こしている可能性があり、X と Y の両方が共通の原因 Z に応答している可能性があり、世界にこれらの効果が混合している (例: 共通の原因と Y が X に与える影響) など、またはその他の因果構造が含まれている可能性があるため、モデルが世界と一致しない場合があります。完璧な適合は、モデルの構造が世界の構造と一致することを示しているわけではなく、これは逆に、完璧な適合に近づくことが必ずしも世界の構造に近づくことと一致するわけではないことを意味します。一致する場合もあれば、一致しない場合もあります。したがって、研究者が、モデルが完全に適合しているからといって、そのモデルが因果的に正しく規定されていると主張するのは誤りです。中程度に複雑なモデルであっても、完全に等価に適合するモデルは稀です。どのような指標においてもデータにほぼ適合するモデルは、潜在的に重要でありながら未知のモデルの誤規定を必然的に導入します。このようなモデルは、研究にとって大きな障害となります。
この論理的な弱点により、構造方程式モデルがデータと著しく矛盾する場合、すべての適合指標は「役に立たない」ものとなる[ 39 ]。しかし、適合指標の使用を広める力はいくつかある。例えば、ダグ・ソルボムは、最初の構造方程式モデリングプログラムの開発者であるカール・ヨレスコグに「では、なぜLISRELプログラムにGFIを追加したのですか?」と尋ねられた際、ヨレスコグは「LISRELが常に大きなカイ二乗値を生成するなら、ユーザーからLISRELの使用をやめると脅されるのです。ですから、人々を満足させる何かを発明する必要がありました。GFIはその目的を果たします」と答えたと報告している[ 41 ] 。モデルとデータの不整合を示すカイ二乗係数の証拠は、統計的に非常に確固としたものであり、排除したり捨てたりすることはできないが、少なくとも人々に「不安な」証拠から目をそらす方法を提供することはできるだろう。追加の指標を開発し、指標の挙動に関する調査結果を報告し、モデルとデータの不整合の証拠を意図的にMDI(気が散る指標の山)の下に隠したモデルを発表することで、依然としてキャリア上の利益を得られる可能性があります。研究者が、検出された誤ったモデル規定を修正しようと試みるのではなく、因果的に誤ったモデルを「受け入れる」べき理由について、一般的な正当性はないように思われます。また、一部の文献では、「モデルを受け入れる」(指標値を「満たす」という根拠に基づいて)ことが、帰無仮説の「受け入れ」に適用される批判のより強いバージョンに悩まされていることに気づいていないようです。統計学の入門書では通常、「受け入れる」という用語を「帰無仮説を棄却できなかった」に置き換え、タイプIIエラーの可能性を認めることが推奨されています。タイプIIIエラーは、現在のデータがモデルを棄却するのに十分であるにもかかわらず、モデル仮説を「受け入れる」ことから生じます。
研究者が世界の構造を探求することに真摯に取り組むかどうかは、根本的な懸念事項である。モデルとデータの不整合を示すテスト証拠を、適合度が許容範囲内であるという指標の主張の背後に隠蔽することで、その分野が構造的に改善された分野の理解を得るために行ってきたであろうあらゆる努力から注意を逸らすという、分野全体にわたるコストが生じる。その分野は、モデルの誤指定の証拠を指標に基づいて置き換えることで、最終的に実質的なコストを支払うことになる。モデルの誤指定を修正する必要性に関する意見の相違によって生じる摩擦は、因子構造化されていないモデルの使用が増え、類似しつつも重要な点で異なる潜在変数を示す、より少ない、より正確な指標の使用が増えるにつれて、おそらく増大するだろう。[ 35 ]
適合指標の使用に関連する考慮事項には、次の点の確認が含まれます。
よく使われる適合統計には次のようなものがある。
以下の表は、RMSEA(近似値の平均二乗誤差)、SRMR(標準化平均二乗残差)、CFI(確認的適合指数)、TLI(タッカー・ルイス指数)といった一般的な指標について、これらの特徴やその他の特徴をまとめた参考文献を示しています。AIC(赤池情報量基準)などのその他の指標は、ほとんどのSEM入門書に掲載されています。[ 30 ]各適合度指標において、モデルとデータの間の適合度が十分に高いと判断されるかどうかは、研究者のモデリング目的(他者のモデルに異議を唱えること、あるいは測定を改善することなど)、モデルが「検証済み」であると主張するかどうか、そして指標によって裏付けられた不適合度の証拠を「無視」することに研究者が抵抗がないかどうかによって決まります。[ 33 ]
| RMSEA | SRMR | CFI | |
|---|---|---|---|
| インデックス名 | 近似値の二乗平均平方根誤差 | 標準化残差平均平方根 | 確認適合指数 |
| 式 | RMSEA = 平方根(( χ 2 - d)/(d(N-1))) | ||
| 基本的な参考資料 | [ 46 ] [ 47 ] [ 48 ] | ||
| 因子モデルの提案文言 臨界値について | .06の文言?[ 42 ] | ||
| 非因子モデルの提案文言 臨界値について | |||
| 改訂/変更を提案する参考文献、 重要な価値観に関する意見の相違 | [ 42 ] | [ 42 ] | [ 42 ] |
| 2つのインデックスまたはペアインデックスを示す参照 基準が必要です | [ 42 ] | [ 42 ] | [ 42 ] |
| χ 2に基づく指標 | はい | いいえ | はい |
| 使用を推奨しない参考文献 このインデックスの | [ 39 ] | [ 39 ] | [ 39 ] |
研究者は、安定した係数推定値と妥当な検定力を提供するにはサンプルが十分に大きい必要があることに同意していますが、必要な特定のサンプルサイズ、または適切なサンプルサイズを決定する方法さえも、一般的なコンセンサスはありません。推奨事項は、推定される係数の数、モデル化変数の数、および特定のモデル係数を扱ったモンテカルロシミュレーションに基づいています。[ 30 ] 指標の数と潜在変数の数の比率に基づくサンプルサイズの推奨事項は要因指向であり、固定されたゼロ以外の測定誤差分散を持つ単一の指標を採用しているモデルには適用されません。[ 35 ] 全体的に、統計的に推定が難しい係数のない中規模のモデルの場合、必要なサンプルサイズ(N)は、すべての指標を採用した回帰に必要なNとほぼ同等のようです。
サンプルサイズが大きいほど、因果的に均質でないケースが含まれる可能性が高くなります。したがって、望ましい係数を統計的に有意であると報告できる可能性を高めるために N を増やすと、モデルの誤指定のリスクと、誤指定を検出する検出力が同時に高まります。モデリングから学習しようとする研究者(モデルの調整や置き換えが必要であることの学習も含む)は、資金と集団ベースの因果的異質性/均質性の評価によって許される限り、サンプルサイズを大きくしようと努めます。利用可能な N が非常に大きい場合、ケースのサブセットをモデリングすることで、因果的均質性を乱す可能性のある変数を制御できます。モデルの欠陥を報告しなければならない可能性を懸念する研究者は、関心のある構造係数を検出するのに十分な検出力を得るために N を大きくしたいという思いと、モデルとデータの不整合を示す検出力を避けるという思いの間で板挟みになっています。モデル構造とデータ特性の大きなばらつきは、同様のデータで推定された同等のサイズと複雑さのモデルに関する他の研究者の経験 (良い経験と悪い経験の両方) を考慮することによって、適切なサンプル サイズを効果的に見つけられる可能性があることを示唆しています。
SEモデルの因果解釈は最も明確で理解しやすいものですが、モデルの構造が世界の因果構造と一致していない場合、その解釈は誤りとなります。したがって、解釈は、モデルの推定係数だけでなく、モデルの全体的な状態と構造に焦点を当てるべきです。モデルがデータに適合するかどうか、そして/またはモデルがどのようにしてデータに適合するようになったかは、解釈において最も重要です。探索的研究や逐次的な修正指標の追跡によって得られたデータの適合度は、モデルが間違っていることを保証するものではありませんが、これらのアプローチはデータの特徴を誤ってモデル化する傾向があるため、深刻な疑問を提起します。例えば、必要な因子数を調べるための探索的研究は、データが因子構造化されていないことを発見するのを先取りします。特に、測定誤差共分散を含めることで因子モデルに適合するように「説得」されている場合はなおさらです。データが仮定モデルに反論する能力は、「修正指標が示唆する」効果や誤差共分散を不当に含めるたびに、徐々に低下していきます。初期モデル/ベースモデルにいくつかの誤った指定が含まれている場合、適切なモデルを回復することは非常に困難になります。[ 49 ]
直接効果の推定値は、回帰方程式の係数の解釈と並行して解釈されますが、因果関係を考慮します。因果変数の値の各単位増加は、他のすべての作用/モデル化された因果メカニズムを制御または調整した上で、従属変数の値の推定値の変化を生み出すものと見なされます。間接効果も同様に解釈され、特定の間接効果の規模は、その間接効果を構成する一連の直接効果の積に等しくなります。関係する単位は、観測変数の値の実尺度と、潜在変数に割り当てられた尺度値です。特定の指標に対する潜在変数の指定/固定された1.0効果は、その指標の尺度を潜在変数の尺度と調整します。モデルの残りの部分は一定または不変であるという仮定は、現実世界では実単位の増加によって同時に引き起こされる可能性のある間接効果を軽視することを必要とする場合があります。また、因果変数の値を変える方法が知られていない可能性があるため、単位増加自体が現実世界で起こり得ることと矛盾する可能性がある。モデルが測定誤差を調整する場合、その調整によって潜在レベルの効果が真のスコアの変動を指すと解釈することが可能になる。[ 29 ]
SEM解釈は、因果係数のネットワークが潜在変数を結び付けるときに、回帰解釈から最も根本的に離れる。回帰には間接効果の推定値が含まれていないからである。SEM解釈は、背景変数から介在変数を介して下流の従属変数に効果を運ぶ間接効果のパターンの結果を伝えるべきである。SEM解釈は、複数の因果経路がどのように協調して、または独立して、あるいは互いに打ち消し合うことができるかを理解することを促す。直接効果は間接効果によって打ち消される(または強化される)可能性があり、あるいはその相関的含意は共通の原因の効果によって打ち消される(または強化される)可能性がある。[ 16 ]特定の推定値の意味と解釈は、完全なモデルの中で文脈化されるべきである。
SE モデルの解釈では、特定のモデル因果セグメントをその分散および共分散の意味に結び付ける必要があります。単一の直接効果は、独立変数の分散が従属変数の値に特定の量の変動を生み出すことを報告しますが、単一の効果係数には、その効果がどのように発生するかの構造化されたストーリーに統合できるサブコンポーネントが含まれていないため、正確に何が原因でこれが起こるのかという因果の詳細は指定されません。原因と結果の間に介在する変数を組み込んだ、よりきめ細かい SE モデルでは、1 つの効果がどのように機能するかについてのストーリーを構成する特徴を提供する必要があります。そのようなモデルが登場するまでは、推定された各直接効果には未知の色合いが残り、それによって理論の本質が呼び起こされます。よりきめ細かいモデルであっても、推定された各係数にはそれと並行した本質的な未知数が伴うため、SE モデルから根本的な謎の感覚が完全に払拭されることはありません。
モデル化された各効果が、関係する変数の同一性と効果の推定大きさ以外は不明である場合でも、モデル化された複数の効果を結び付ける構造は、観測された変数を調整するために物事がどのように機能するかを表現する機会を提供し、それによって有用な解釈の可能性を提供します。たとえば、共通の原因は、影響を受ける 2 つの変数間の共分散または相関に寄与します。なぜなら、原因の値が上昇すれば、各原因の背景にあるすべてのストーリーがわからなくても、両方の効果の値も上昇するはずだからです (正の効果が想定される場合)。[ 16 ] (相関とは、分散が 1.0 になるように標準化された 2 つの変数間の共分散です)。もう 1 つの解釈への寄与は、2 つの原因変数が両方とも従属変数の分散を説明できる方法と、そのような 2 つの原因間の共分散が従属変数の説明される分散を増加または減少させる方法を表現することによってなされる可能性があります。つまり、解釈には、効果と共分散のパターンが従属変数の分散の減少にどのように寄与するかを説明することが含まれる場合があります。[ 50 ]因果関係の理解は暗黙的に「制御」の理解につながり、ある変数は制御すべきで、他の変数は制御すべきでない理由を説明できる可能性がある。[ 5 ] [ 51 ]モデルが複雑になるにつれて、これらの基本的な要素は直感的でない方法で組み合わされる可能性がある。例えば、2つの変数が直接的な非ゼロの因果効果によって結びついているにもかかわらず、2つの変数間に相関関係(共分散ゼロ)が存在しない理由を説明するなどである。[ 16 ] [ 17 ] [ 7 ] [ 32 ]
効果推定値の統計的有意性の欠如は、推定値がヌル/ゼロ効果の周りのランダム標本変動として容易に生じる可能性があることを示しており、したがって、推定値を真の効果として解釈することは不明確となる。回帰分析と同様に、各従属変数の分散のうち、モデル化された原因の変動によって説明される割合はR 2によって示されるが、従属変数が相互効果またはループ効果を持つ場合、または従属変数が予測変数の誤差変数と相関する誤差変数を持つ場合は、ブロック誤差R 2 を用いるべきである。[ 52 ]
モデル評価セクションに記載されている注意事項は、改めて強調する価値があります。モデルがデータと整合しているかどうかに関わらず、解釈は可能であるべきです。推定値は、モデルを信じる人にとって世界がどのように見えるかを報告しています。たとえその信念が根拠のないもので、モデルが誤っている場合であってもです。解釈においては、モデルの係数が「パラメータ」に対応する場合もあれば、対応しない場合もあることを認識する必要があります。モデルの係数が、対応する世界構造上の特徴を持たない可能性があるからです。
新たな潜在変数を、いくつかの明確な因果関係のある場所/変数において元のモデルに出入りさせることで、モデルの誤指定を検出することに貢献する。そうしないと係数の解釈が台無しになる可能性がある。新たな潜在変数の指標と元の指標すべてとの間の相関は、元のモデルの構造を検証するのに役立つ。なぜなら、少数の新たな焦点を絞った効果係数は、モデルの元の直接効果および間接効果と連携して、新たな指標を元の指標と調整する必要があるからである。元のモデルの構造に問題があった場合、疎な新たな因果関係は、新たな指標を元の指標と調整するのに不十分となり、モデルとデータの不整合を通じて、元のモデルの係数の不適切さを示すことになる。[ 32 ]ヌル/ゼロの効果係数、および固定された非ゼロ値が割り当てられた係数に基づく相関制約は、モデル検証と係数推定の両方に貢献するため、推定とその解釈を支える足場として認識されるに値する。[ 32 ]
相互作用、非線形性、複数のグループ、複数のレベル、カテゴリ変数を含むモデルでは、解釈は次第に複雑になります。[ 30 ] 因果ループ、相互効果、または相関残差に関係する効果についても、若干の修正された解釈が必要です。[ 7 ] [ 32 ]
適合モデルと適合モデルの両方を注意深く解釈することで、研究の進展につながる可能性があります。信頼できるモデルとは、学術的に有益な因果構造を調査し、適用可能なデータに理解しやすい推定値を当てはめ、空虚な係数を含まないモデルであるべきです。[ 53 ]適合モデルが信頼できるのは、適合モデルが失敗したモデルや、不適切に無理やり適合させたモデルよりも稀ですが、適合モデルが適切に適合するモデルは存在します。[ 37 ] [ 54 ] [ 55 ] [ 56 ]
PLSモデルを概念化する複数の方法[ 57 ]は、PLSモデルの解釈を複雑にする。上記のコメントの多くは、PLSモデラーが現実主義的な視点を採用し、モデル化された指標が、存在するが利用できない潜在変数と一致するように組み合わせられるように努める場合に当てはまる。R2やサンプル外予測力に主眼を置くような非因果的PLSモデルでは、モデルの係数に現実世界に対応するものがあるかどうかの懸念が薄れるため、解釈基準が変わる。Rigdon、Sarstedt、Ringle [ 57 ]が論じた5つのPLSモデリングの観点を区別する基本的な特徴は、 PLSモデラーの目的の違いと、それに対応する解釈を必要とするモデル特性の違いを示している。
実験や時系列調査が実施された場合でも、因果関係を主張する際には注意が必要です。因果モデルという用語は、「因果関係の仮定を伝えるモデル」という意味で理解されるべきであり、必ずしも検証された因果関係の結論を導き出すモデルである必要はありません。検証された因果関係の結論を導き出すモデルである場合もありますし、そうでない場合もあります。複数の時点でデータを収集し、実験的または準実験的なデザインを用いることで、特定の対立仮説を排除することができますが、ランダム化実験であっても因果関係の主張に対する脅威を完全に排除することはできません。いかなる研究デザインも因果構造を完全に保証することはできません。[ 5 ]
構造方程式モデリングは多くの論争を巻き起こしています。因子分析の伝統を持つ研究者は、一般的に、複数の指標セットを、より少数で扱いやすい尺度または因子スコアに削減し、パス構造モデルで後ほど使用しようとします。これは段階的なプロセスであり、最初の測定ステップで、パス構造モデルで後ほど使用する尺度または因子スコアが提供されます。この段階的なアプローチは一見明白に見えますが、実際には深刻な根本的な欠陥を抱えています。段階への分割は、尺度または因子スコアが指標を適切に表しているか、および/または潜在レベルの効果を適切に報告しているかを徹底的に検証することを妨げます。測定レベルと潜在レベルの構造の両方を同時に組み込んだ構造方程式モデルは、潜在因子が指標を適切に調整しているかどうかだけでなく、同じ潜在因子が各潜在因子の指標を、その潜在因子の理論上の原因および/または結果の指標と同時に適切に調整しているかどうかも検証します。[ 32 ]潜在的要因がこれらの両方の調整スタイルを実行できない場合、その潜在的要因の妥当性が疑問視され、その潜在的要因を測定するとされる尺度や因子スコアも疑問視される。意見の相違は、仮定された潜在的要因の妥当性に疑問を投げかける証拠を尊重するか、軽視するかをめぐって渦巻いた。くすぶる、時には沸騰する議論の結果、HaydukとGlaserによる論文[ 21 ]を特集したStructural Equation Modeling誌の特集号が発行され 、その後、いくつかのコメントと反論[ 22 ]がGeorge Marcoulidesの尽力により無料で公開された。
これらの議論は、構造方程式モデルがデータとの整合性を検証すべきかどうかという点で意見の相違を助長し、モデル検証が次の議論の焦点となった。パスモデリングの経験を持つ研究者は慎重なモデル検証を擁護する傾向があり、因子モデリングの経験を持つ研究者は適合度検証よりも適合指数化を擁護する傾向があった。これらの議論は、ポール・バレット[ 39 ]による『パーソナリティと個人差』誌上の論説記事に繋がり 、彼は次のように述べている。「実際、私は今、モデルの「受容性」や「不適合度」を示すような指標を論文に一切使用しないことを推奨する。」[ 39 ](821ページ)。バレットの論説には、双方の視点からのコメントも添えられていた。[ 53 ] [ 58 ]
モデルとデータの重大な不整合を明確に報告することが義務付けられるにつれ、モデル検定をめぐる論争は減少した。科学者は、証拠の報告内容が気に入らないという理由だけで、証拠を無視したり、報告を怠ったりすることはできない。[ 33 ]モデルの誤った特定化を示唆する証拠に注意を払う必要性は、近年の「内生性」への懸念の根底にある。内生性とは、誤差/残差変数の独立性の欠如により推定に支障をきたす、モデルの誤った特定化の一種である。一般的に、因子モデルを含む構造方程式モデルの因果関係をめぐる論争も減少している。因子分析の重鎮であるスタン・ムライクは、因子モデルの因果関係を認めている。[ 59 ]ボレンとパールによるSEMにおける因果関係に関する誤解に関するコメント[ 26 ]は、SEMにおける因果的思考の重要性を改めて強調した。
競合するモデルに焦点を当てた、より簡潔な論争。競合するモデルを比較することは非常に有用であるが、2つのモデルを作成し、より適合度の高いモデルを保持するだけでは解決できない根本的な問題がある。例えば、Levy and Hancock (2007) [ 60 ]のような発表の統計的洗練さは、研究者が1つのひどいモデルと1つのひどいモデルから始めて、何らかの指標がひどいモデルよりも適合度が高いと報告しているために、最終的に構造的にひどいモデルを保持する可能性があることを見落としがちである。Kline (2016) [ 30 ]のような他の点では強力な SEM テキストでさえ、モデル検定の発表が依然として不安になるほど弱いのは残念である。[ 61 ] 全体として、構造方程式モデリングによってもたらされる貢献は、たとえ失敗したモデルがたまたま利用可能な最良のモデルであったとしても、慎重で詳細なモデル評価にかかっている。
これまでの論争の周辺に触れた、さらなる論争が巻き起ころうとしている。因子モデルや理論に組み込まれた因子構造は複数の指標を持つ場合、失敗する傾向があり、弱い指標を削除すると、モデルとデータの不整合が軽減される傾向がある。指標の数を減らすと、構造方程式モデルの潜在変数をサポートするのに必要な指標の最小数に関する懸念と論争につながる。因子の伝統に縛られている研究者は、潜在変数ごとに指標の数を3つに減らすように説得されるかもしれないが、3つ、あるいは2つの指標でさえも、提案された根本的因子共通原因と矛盾する可能性がある。HaydukとLittvay (2012) [ 35 ]は、モデル化された潜在変数ごとに1つの指標のみを使用する場合の測定誤差についてどのように考え、擁護し、調整するかについて議論した。単一指標はSEモデルにおいて長い間効果的に使用されてきたが[ 54 ]、因子分析の観点からのみ測定を検討した査読者の間では論争が続いている。
これらの論争の痕跡は、減少傾向にあるとはいえ、SEM文献全体に散在しており、次のような問いかけによって容易に意見の相違を招きかねません。データと著しく矛盾するモデルに対してはどう対処すべきでしょうか?あるいは、モデルの単純さは、データの矛盾を示す証拠の尊重よりも優先されるべきでしょうか?あるいは、一部のモデルにおいて、データ適合度が近い、あるいはそれほど近くない指標には、どの程度の重み付けをすべきでしょうか?あるいは、データと矛盾する倹約的なモデルに対しては、特に寛容に、あるいは「報奨」を与えるべきでしょうか?あるいは、RMSEAが各モデルの自由度における実際の不適合を無視することを容認していることを考えると、RMSEAがゼロでない帰無仮説を用いてモデルを検定する人々は、不十分なモデル検定を行っていることになるのではないでしょうか?こうした問いに説得力を持って答えるには、統計的知識の高度な知識にかなりのばらつきが必要ですが、回答は、研究者が証拠を報告し、尊重する必要があるかどうかという、技術的ではない問題に集中する可能性が高いでしょう。
構造方程式モデリングプログラムは、その機能とユーザー要件が大きく異なります。[ 69 ]以下は利用可能なソフトウェアの表です。
| 名前 | ライセンス | プラットフォーム | アドオンパッケージ | リンク | 共分散ベース | 差異ベース |
|---|---|---|---|---|---|---|
| Mプラス | コマーシャル | Windows、Mac、Linux | スタンドアロン | statmodel.com | ✓ | |
| アモス | コマーシャル | ウィンドウズ | スタンドアロン | ibm.com | ✓ | |
| ラヴァーン | オープンソース | Windows、Mac、Linux | Rのアドオン | lavaan.org | ✓ | |
| ラヴァアンギ | オープンソース | Windows、Mac、Linux | Rおよびスタンドアロン のアドオン | lavaangui.org | ✓ (ラヴァーンを使用) | |
| リスレル | コマーシャル | ウィンドウズ | スタンドアロン | ssicentral.com | ✓ | |
| EQS | コマーシャル | Windows、Mac、Linux | スタンドアロン | mvsoft.com | ✓ | |
| スタタ | コマーシャル | Windows、Mac、Linux | スタンドアロン | stata.com | ✓ | |
| SAS | コマーシャル | Windows、Mac、Linux | スタンドアロン | sas.com | ✓ | |
| セモピー | オープンソース | Windows、Mac、Linux | Pythonのアドオン | semopy.com | ✓ | |
| セム | オープンソース | Windows、Mac、Linux | Rのアドオン | cran.r-project.org | ✓ | |
| オープンMX | オープンソース | Windows、Mac、Linux | Rのアドオン | openmx.ssri.psu.edu | ✓ | |
| オニュクス | オープンソース | Windows、Mac、Linux | スタンドアロン | onyx.brandmaier.de | ✓ | |
| スマートPLS4 | コマーシャル | ウィンドウズ、マック | スタンドアロン | スマートプラス | ✓ | ✓ |
| PLSグラフ | コマーシャル | ウィンドウズ | スタンドアロン | plsgraph.com | ✓ | |
| ワープPLS | コマーシャル | ウィンドウズ | スタンドアロン | warppls.com | ✓ | |
| アダンコ | コマーシャル | ウィンドウズ、マック | スタンドアロン | 複合モデリング.com | ✓ | |
| LVPLS | フリーウェア | MS-DOS | スタンドアロン | www2.kuas.edu.tw | ✓ | |
| マトリックスpls | オープンソース | Windows、Mac、Linux | Rのアドオン | cran.r-project.org | ✓ | |
| 半減期R | オープンソース | Windows、Mac、Linux | Rのアドオン | https://github.com/sem-in-r/seminr | ✓ (ラヴァーンを使用) | ✓ |
| ジャモヴィ | オープンソース | Windows、Mac、Linux | Rのアドオン | https://www.jamovi.org/ | ✓ (ラヴァーンを使用) | ✓ |
| ジャスプ | オープンソース | Windows、Mac、Linux | Rのアドオン | https://jasp-stats.org/ | ✓ (ラヴァーンを使用) | ✓ |
仮説的な基礎概念モデルまたは理論モデルによって定義される少数の「構造」パラメータに基づいて、観測データの平均、分散、共分散に関する仮説を表現しようとする方法論のクラスとして定義できます。
{{cite book}}: CS1 メンテナンス: 場所の発行元が見つかりません (リンク){{citation}}: CS1 maint: ISBNによる作業パラメータ(リンク)