測定不変性または測定等価性は、測定の統計的特性であり、特定のグループ間で同一の構成概念が測定されていることを示す。 [1]例えば、測定不変性は、特定の測定尺度が異なる性別や文化的背景を持つ回答者によって概念的に同様の解釈がなされるかどうかを調べるために用いることができる。測定不変性に反する場合には、測定データの有意義な解釈が妨げられる可能性がある。測定不変性の検定は、心理学などの分野で、古典的な検定理論に基づく測定品質の評価を補完するためにますます利用されている。[1]
測定不変性は、多群確認的因子分析(CFA)の枠組みの中で検証されることが多い。[2] CFAを含む構造方程式モデルの文脈では、測定不変性は因子不変性と呼ばれることが多い。[3]
意味
共通因子モデルでは、測定不変性は次の等式として定義されます。
ここで、は分布関数、は観測得点、は因子得点、sはグループ所属度を表す(例:白人=0、アフリカ系アメリカ人=1)。したがって、測定不変性とは、被験者の因子得点が与えられれば、その観察得点はその被験者のグループ所属度に依存しないことを意味する。[4]
不変性の種類
連続的な結果に対する共通因子モデルでは、いくつかの異なるタイプの測定不変性を区別することができる。[5]
- 1)均等形式: 因子の数と因子指標関係のパターンはグループ間で同一です。
- 2)等負荷:因子負荷はグループ間で等しくなります。
- 3)等しい切片: 観測されたスコアを各因子で回帰すると、切片はグループ間で等しくなります。
- 4)等残差分散: 因子によって説明されない観測スコアの残差分散はグループ間で等しくなります。
同じ類型論を離散的結果のケースにも一般化できます。
- 1)均等形式: 因子の数と因子指標関係のパターンはグループ間で同一です。
- 2)等負荷:因子負荷はグループ間で等しくなります。
- 3)等しい閾値: 観測されたスコアが各因子で回帰分析されると、閾値はグループ間で等しくなります。
- 4)等残差分散: 因子によって説明されない観測スコアの残差分散はグループ間で等しくなります。
これらの条件はそれぞれ、特定の制約条件を伴う多群確認因子モデルに対応しています。各モデルの妥当性は、尤度比検定やその他の適合指標を用いて統計的に検証できます。グループ間の意味のある比較には通常、4つの条件すべてが満たされている必要があり、これは厳密な測定不変性として知られています。しかし、厳密な測定不変性は応用分野ではほとんど成立しません。[6]通常、これは等形式条件から始めて、モデルの適合度が低下しない限り、最終的に等残差条件へと進むという追加の制約を順次導入することによって検証されます。
不変性のテスト
さまざまな不変性検定とそれぞれの基準を多様な検定条件に適用することについてはさらなる研究が必要ですが、応用研究者の間では 2 つのアプローチが一般的です。比較される各モデル (例: 等形式、等切片) について、 モデルが暗示する平均および共分散行列と観測された平均および共分散行列の差を最小化することから、χ 2 適合統計量が反復的に推定されます。[ 7 ]比較するモデルがネストされている限り、さまざまなレベルの不変性を持つ任意の 2 つの CFA モデルのχ 2値とそれぞれの自由度の差はχ 2分布 (diff χ 2 ) に従うため、ますます制限的なモデルがモデルとデータの適合に顕著な変化をもたらすかどうかの指標として有意性を検査できます。[7]ただし、diff χ 2は、不変性の対象となる制約 (例: サンプル サイズ) の変化とは無関係の要因に敏感であるという証拠がいくつかあります。 [8]そのため、研究者は測定不変性を調査するために指定された2つのモデルの比較適合指数(ΔCFI)の差も用いることが推奨される。測定不変性のレベルが異なる2つのモデル(例えば、等価モデルと等価負荷量)のCFIの差が-0.01未満(つまり、0.01以上低下する)の場合、不変性はおそらく維持できない。[8]減算されるCFI値は、diff χ 2 検定 の場合と同様に、ネストされたモデルから得られると予想される。 [9]しかし、応用研究者はCFI検定を適用する際にこの点をほとんど考慮していないようである。[10]
同等性のレベル
このセクションは拡張が必要です。追加していただけると助かります。 (2018年3月) |
同等性は、測定同等性の3つの階層的レベルに従って分類することもできる。[11] [12]
- 構成的等価性: 多群確認的因子分析において、因子構造はグループ間で同じです。
- 指標の等価性:因子負荷量はグループ間で類似している。[11]
- スカラー等価性:値/平均値もグループ間で同等である。[11]
実装
測定不変性の検定はRプログラミング言語で利用できる。[13] [14]
批判
著名な政治学者クリスチャン・ウェルツェルと彼の同僚は、異文化統計における文化的および心理的構成概念の妥当性の基準として不変性テストに過度に依存していることを批判している。彼らは、不変性基準はグループ間分散の低い構成概念に有利であるのに対し、グループ間分散の高い構成概念はこれらのテストに不合格になることを実証した。グループ間分散が高いことは、確かに、構成概念が異文化比較に有用であるためには必要である。グループ間分散は、いくつかのグループ平均がクローズドエンドスケールの両端に近い場合に最も高くなり、その場合グループ内分散は必然的に低くなる。グループ内分散が低いと相関関係と因子負荷量が低くなり、学者はこれを不一致の兆候と定期的に解釈する。ウェルツェルと彼の同僚は、代わりに、構成概念がグループ間差異の他の尺度と予想される方法で相関するかどうかに基づく、構成概念妥当性の法理学的基準に依存すべきことを推奨している。彼らは、異文化比較において高い説明力と予測力を持つにもかかわらず、不変性のテストに失敗する文化的構成概念の例をいくつか挙げている。[15] [16]不変性テストの支持者は、法則的連鎖への依存は、そのような外部検証が比較可能性の仮定にかかっていることを無視していると反論している。[17]
参照
参考文献
- ^ ab Vandenberg, Robert J.; Lance, Charles E. (2000). 「測定不変性に関する文献のレビューと統合:組織研究のための提案、実践、そして推奨事項」. Organizational Research Methods . 3 : 4– 70. doi :10.1177/109442810031002. S2CID 145605476.
- ^ Chen, Fang Fang; Sousa, Karen H.; West, Stephen G. (2005). 「二次因子モデルの測定不変性の検証」.構造方程式モデリング. 12 (3): 471– 492. doi :10.1207/s15328007sem1203_7. S2CID 120893307.
- ^ Widaman, KF; Ferrer, E.; Conger, RD (2010). 「縦断的構造方程式モデルにおける因子不変性:時間経過に伴う同一構成概念の測定」. Child Development Perspectives . 4 (1): 10– 18. doi :10.1111/j.1750-8606.2009.00110.x. PMC 2848495. PMID 20369028 .
- ^ Lubke, GH; et al. (2003). 「共通因子モデルにおけるグループ内およびグループ間差異の要因と測定不変性の関係について」. Intelligence . 31 (6): 543– 566. doi :10.1016/s0160-2896(03)00051-5.
- ^ Brown, T. (2015). 応用研究のための確証的因子分析 第2版. ギルフォード出版.
- ^ ヴァン・デ・シュート、レンス;シュミット、ピーター。アラン・デ・ブーケラール。レック、キンバリー。ゾンダーヴァン・ツヴァイネンブルク、マリエル (2015-01-01)。 「社説: 測定の不変性」。心理学のフロンティア。6 : 1064.土井: 10.3389/fpsyg.2015.01064。PMC 4516821。PMID 26283995。
- ^ ab Loehlin, John (2004).潜在変数モデル:因子分析、パス分析、構造方程式分析入門. Taylor & Francis. ISBN 978-0-8058-4910-3。
- ^ ab Cheung, GW; Rensvold, RB (2002). 「測定不変性の検定のための適合度指標の評価」.構造方程式モデリング. 9 (2): 233– 255. doi :10.1207/s15328007sem0902_5. S2CID 32598448.
- ^ Widaman, Keith F.; Thompson, Jane S. (2003-03-01). 「構造方程式モデリングにおける増分適合指標の帰無モデル指定について」.心理学的方法. 8 (1): 16– 37. CiteSeerX 10.1.1.133.489 . doi :10.1037/1082-989x.8.1.16. ISSN 1082-989X. PMID 12741671.
- ^ Kline, Rex (2011).構造方程式モデリングの原理と実践. Guilford Press.
- ^ abc Steenkamp, Jan-Benedict EM; Baumgartner, Hans (1998-06-01). 「国際消費者調査における測定不変性の評価」. Journal of Consumer Research . 25 (1): 78– 90. doi :10.1086/209528. ISSN 0093-5301. JSTOR 10.1086/209528.
- ^ アリエリー・ガル、ダビドフ・エルダド (2012年9月1日). 「政治科学における国際比較・縦断的調査による測定の同等性評価」.ヨーロッパ政治科学. 11 (3): 363– 377. doi : 10.1057/eps.2011.11 . ISSN 1680-4333.
- ^ Hirschfeld, Gerrit; von Brachel, Ruth (2014). 「Rによる多群確認的因子分析の改善 - 連続指標と順序指標を用いた測定不変性に関するチュートリアル」『実用評価、研究、評価』19. doi :10.7275/qazy-2946.
- ^ Kim, JY; Newman, DA; Harms, PD; Wood, D. (2023). 「知覚された奇妙さ:自己および他者の正常性評価に関する多特性・多情報源研究」パーソナリティ科学4 . doi : 10.5964 /ps.7399 .
- ^ Welzel, Christian; Brunkert, Lennart; Kruse, Stefan; Inglehart, Ronald F. (2021). 「非不変性?誤解された原因による誇張された問題」. Sociological Methods & Research . 1 (33): 1368– 1400. doi : 10.1177/0049124121995521 .
- ^ Welzel, Christian; Kruse, Stefan; Brunkert, Lennart (2022). 「主流への反論:非不変性診断の限界について:FischerらおよびMeulemanらへの応答」『社会学的方法と研究』52 (3) 00491241221091754. doi : 10.1177/00491241221091754 .
- ^ Meuleman, Bart; Żółtak, Tomasz (2022). 「比較研究において測定不変性が重要な理由:Welzelら (2021)への応答」(PDF) . Sociological Methods & Research . 52 (3) 00491241221091755. doi :10.1177/00491241221091755.