多項式ラッシュモデル

多値ラッシュモデルは、二値ラッシュモデルの一般化です。これは、項目への回答を連続する整数で採点するプロセスを通じて特性または能力を測定することを目的とするあらゆる状況に応用可能な測定モデルです。例えば、このモデルは、リッカート尺度評価尺度、そして連続的に高くなる整数得点が能力または達成度の上昇を示すことを意図した 教育評価項目の使用に適用できます。

背景と概要

多項式ラッシュモデルは、ラッシュ(1961)とアンダーセン(1977)による導出に続き、アンドリッチ(1978)によって、ラッシュモデルの一般形の関連項を閾値パラメータ弁別パラメータに分解することで導出された。このモデルが導出された際、アンドリッチは、説明目的とモデルの解釈を助けるために、 心理測定学におけるリッカート尺度の使用に焦点を当てた。

このモデルは、(i) 項目が同じ数の閾値を持ち、(ii) 逆に、任意の閾値位置と閾値位置の平均との差が項目間で等しいか均一である場合に、評価尺度モデルと呼ばれることがあります。ただし、このモデルは、いわゆる評価尺度よりもはるかに一般的な適用範囲を持つため、誤解を招く可能性があります。このモデルは、特に教育の場で適用される場合、部分的評価モデルと呼ばれることもあります。部分的評価モデル ( Masters 1982 ) は同一の代数形式を持ちますが、後になって異なる出発点から導き出されたため、解釈の仕方が多少異なります。部分的評価モデルでは、項目ごとに異なる閾値も許容されます。このモデル名はよく使用されますが、Andrich (2005)は、Masters のアプローチの要素に関連する問題について詳細な分析を行っています。これらの問題は、モデルと互換性のある応答プロセスのタイプ、および閾値位置の推定値が無秩序な経験的状況に特に関連しています。これらの問題については、後続のモデルの詳細説明で説明します。

このモデルは、ラッシュモデルを定義する特有の特性、すなわち、合計生スコアがモデルのパラメータ十分な統計量であるという特性を維持しながら、連続した整数スコアの使用に関する理論的根拠を提供する一般的な確率的測定モデルです。この特性の詳細については、ラッシュモデルのメイン記事を参照してください。この特性を維持することに加えて、このモデルは、応答カテゴリーが潜在的属性または特性の増加レベルを表し、したがって順序付けられているという仮説を厳密に実証的に検証することを可能にします。このモデルがこの仮説を検証するための基盤を提供する理由は、閾値が意図した順序を示さないことが経験的に起こり得るためです。

二値データに対するラッシュモデルのより一般的な形態では、特定の項目のスコアは、個人が潜在特性上の閾値位置を超えた回数として定義されます。これは、測定プロセスが文字通りそのようなカウントを行うことを意味するのではなく、むしろ、潜在特性連続体上の閾値位置は通常、条件付き最尤推定などの推定プロセスを通じて、回答データのマトリックスから推測されます。一般的に、測定プロセスの中心的な特徴は、個人が連続した、または隣接する、順序付けられた一連のカテゴリーのいずれかに分類されることです。特定の実験状況で採用される回答形式は、いくつかの方法でこれを実現します。例えば、回答者は、ある発言に対する支持度(「強く同意する」など)を最もよく表すと思われるカテゴリーを選択する場合があり、審査員は明確に定義された基準に基づいて個人をカテゴリーに分類する場合があり、個人は、一連の参照刺激との類似性に基づいて物理的刺激を分類する場合があります。

多値Raschモデルは、回答が2つのカテゴリにのみ分類可能な二値データ用のモデルに特化しています。この特殊なケースでは、項目難易度と(単一の)閾値は同一です。閾値の概念については、次のセクションで詳しく説明します。

多項式ラッシュモデル

まず、

Xn×{01メートル}{\displaystyle X_{ni}=x\in \{0,1,\dots ,m_{i}\}\,}

は整数確率変数で、項目iの最大スコアである。つまり、変数は0から最大 までの整数値をとる確率変数である。 メートル{\displaystyle m_{i}}Xn{\displaystyle X_{ni}}メートル{\displaystyle m_{i}}

多項式ラッシュモデル(アンドリッチ1978)では、結果の確率は Xn×{\displaystyle X_{ni}=x}

広報{Xn××>0}経験1×βnτ1+j1メートル経験1jβnτ;{\displaystyle \Pr\{X_{ni}=x,x>0\}={\frac {\exp {{\sum _{k=1}^{x}(\beta _{n}}-{\tau _{ki}})}}{1+\sum _{j=1}^{m_{i}}\exp {{\sum _{k=1}^{j}(\beta _{n}}-{\tau _{ki}})}}};}
広報{Xn0}11+j1メートル経験1jβnτ{\displaystyle \Pr\{X_{ni}=0\}={\frac {1}{1+\sum _{j=1}^{m_{i}}\exp {{\sum _{k=1}^{j}(\beta _{n}}-{\tau _{ki}})}}}}

ここで、 は潜在連続体におけるアイテムiのk番目の閾値位置、 は同じ連続体における人物nの位置、 はアイテムiの最大スコアである。これらの式は次式と同じである。 τ{\displaystyle \tau_{ki}}βn{\displaystyle \beta _{n}}メートル{\displaystyle m_{i}}

広報{Xn×}経験0×βnτj0メートル経験0jβnτ{\displaystyle \Pr\{X_{ni}=x\}={\frac {\exp {{\sum _{k=0}^{x}(\beta _{n}}-{\tau _{ki}})}}{\sum _{j=0}^{m_{i}}\exp {{\sum _{k=0}^{j}(\beta _{n}}-{\tau _{キ}})}}}}

ここで、 の値は計算の便宜上次のように選択されます。 τ0{\displaystyle \tau_{0i}}0メートルβnτ0{\displaystyle \sum _{k=0}^{m_{i}}(\beta _{n}-\tau _{ki})\equiv 0}

評価尺度モデル

同様に、Rasch の「評価スケール」モデル ( Andrich 1978 ) は次のようになります。

広報{Xn×}経験0×βnδτj0メートル経験0jβnδτ{\displaystyle \Pr\{X_{ni}=x\}={\frac {\exp {{\sum _{k=0}^{x}(\beta _{n}-\delta _{i}-\tau _{k}})}}{\sum _{j=0}^{m}\exp {{\sum _{k=0}^{j}(\beta _{n}-\delta _{i}-\tau _{k}})}}}}

ここで、 は項目iの難易度、はすべての項目に共通する評価スケールのk番目の閾値位置です。 mは最大スコアであり、すべての項目で同一です。は計算の便宜上選択されます。 δ{\displaystyle \delta_{i}}τ{\displaystyle \tau_{k}}τ0{\displaystyle \tau_{0}}

応用

このモデルを特定の実証的文脈に適用すると、ある結果の確率は、人物とアイテムのパラメータの確率関数であるという数学的仮説とみなすことができます。人物の位置の関数として特定のカテゴリーの確率の関係を示すグラフは、カテゴリー確率曲線(CPC)と呼ばれます。0から4のスコアが付けられた5つのカテゴリーを持つアイテムのCPCの例を図1に示します。

図1: 5つの順序付けられたカテゴリを持つアイテムのラッシュカテゴリ確率曲線

与えられた閾値は、連続体をその位置の上下の領域に分割します。この閾値は、潜在的連続体上の位置に対応しており、その位置では、人は隣接するカテゴリに分類され、したがって2つの連続するスコアのいずれかを取得する可能性が等しくなります。項目iの最初の閾値は、連続体上の位置であり、人は0または1のスコアを取得する可能性が等しくなります。2番目の閾値は、人が1と2のスコアを取得する可能性が等しくなります。以下同様に続きます。図1の例では、閾値の位置はそれぞれ-1.5、-0.5、0.5、1.5です。 τ{\displaystyle \tau_{ki}}τ1{\displaystyle \tau_{1i}}

回答者は様々な方法でスコアを得ることができます。例えば、リッカート尺度を用いた回答形式が採用されている場合、「強く反対」には0、「反対」には1、「賛成」には2、「強く賛成」には3が割り当てられます。教育心理学における評価の文脈では、読解力など、特定の領域における達成度の上昇を特徴付ける明確な基準や説明に従って、段階的に高い整数スコアが付与されることがあります。共通かつ中心的な特徴は、何らかのプロセスを経て、各個人が評価項目を構成する一連の順序付けられたカテゴリーのいずれかに分類される必要があることです。

モデルの精緻化

Andrich (2005) は、このモデルの特徴を詳しく説明する中で、その構造は同時的な分類プロセスを伴うこと、そしてそれが単一の顕在的反応を導き出すこと、そして一連の二分的な潜在的反応を包含することを明確にしている。さらに、これらの潜在的二分的反応は、以下に示すように、 ガットマン構造とそれに関連する反応空間内で作用する。

させて

はいny{01}{01メートル}{\displaystyle Y_{nk}=y\in \{0,1\},k\in \{0,1,\dots ,m\}\,}

は独立な二値確率変数の集合である。Andrich ( 1978 , 2005 )は、多値Raschモデルでは、これらの二値応答が潜在的なGuttman応答部分空間に従う必要があることを示している。

Ω def {1100}{\displaystyle \Omega '\ {\stackrel {\mathrm {def} }{=}}\ \{1,\dots ,1,0,\dots ,0\}}

ここで、x個の1の後にmx個の0が続きます。例えば、閾値が2つある場合、この応答部分空間で許容されるパターンは以下のとおりです。

000{\displaystyle 0,0\Leftrightarrow 0}
101{\displaystyle 1,0\Leftrightarrow 1}
112{\displaystyle 1,1\Leftrightarrow 2}

ここで、各パターンから得られる整数スコアx(および各パターンから得られる整数スコアx)は図示の通りである。この部分空間がモデルによって得られる理由は以下の通りである。

Pn×経験βnτ1+経験βnτ ×{\displaystyle P_{nxi}={\frac {\exp({\beta _{n}}-{\tau _{ki}})}{1+\exp({\beta _{n}}-{\tau _{ki}})}},\ k=x,\,}

となる確率を とし、 とする。この関数は二値データに対するラッシュモデルの構造を持つ。次に、閾値が2つの場合の 以下の条件付き確率を考える。はいn1{\displaystyle Y_{nki}=1}質問n×1Pn×{\displaystyle Q_{nxi}=1-P_{nxi}}

Pn1質問n2質問n1質問n2+Pn1質問n2+Pn1Pn2{\displaystyle {\frac {P_{n1}Q_{n2}}{Q_{n1}Q_{n2}+P_{n1}Q_{n2}+P_{n1}P_{n2}}}.}

この条件付き確率は次のように表すことができます。

経験11βnτ1+j12経験1jβnτ{\displaystyle {\frac {\exp {{\sum _{k=1}^{1}(\beta _{n}}-{\tau _{k}})}}{1+\sum _{j=1}^{2}\exp {{\sum _{k=1}^{j}(\beta _{n}}-{\tau _{k}})}}}}

これは、多値Raschモデルによって与えられる確率です。これらの式の分母から、この例の確率は、またはの応答パターンに条件付けられていることがわかります。したがって、一般に、応答部分空間は、前に定義したように、多値Raschモデルの構造に固有のものであることは明らかです。部分空間に対するこの制約は、応答の整数スコアリング、つまり、スコアが単に超えた順序付けられた閾値の数である、という正当化に必要です。Andrich (1978)は、各閾値における均等な識別もこの正当化に必要であることを示しました。 Pr{Xni=1}{\displaystyle Pr\{X_{ni}=1\}}{0,0},{1,0},{\displaystyle \{0,0\},\{1,0\},}{1,1}{\displaystyle \{1,1\}}Ω{\displaystyle \Omega '}

多値ラシェモデルでは、与えられた項目のスコアがxである場合、個人が連続体上のある領域より下のx 個の閾値を同時に超え、その領域より上の残りのm  −  x 個の閾値を超えなかったことを意味します。これを可能にするには、図 1 の例に示すように、閾値が自然な順序になっている必要があります。乱れた閾値推定値は、連続したスコアによって表される分類が潜在特性の増加レベルを反映する評価コンテキストを構築できなかったことを示しています。たとえば、閾値が 2 つあり、連続体上で 2 番目の閾値の推定値が 1 番目の閾値の推定値よりも低い状況を考えます。位置を文字どおりに解釈すると、人をカテゴリ 1 に分類することは、その人の位置が 2 番目の閾値を同時に超えるものの、1 番目の閾値を超えなかったことを意味します。言い換えると、これは、上で説明したように、モデルの構造に固有のパターンのサブスペースに属さないパターンである応答パターン {0,1} を意味します。

したがって、閾値推定値が乱れている場合、その推定値は文字どおりには受け取ることができません。むしろ、乱れ自体が、測定の基準として連続する整数スコアを使用することを正当化するために論理的に満たさなければならない基準を、分類が満たしていないことを本質的に示しています。 この点を強調するために、Andrich (2005)は不合格、合格、単位、優等の成績が授与される例を使用しています。 これらの成績、つまり分類は通常、達成度の増加を表すことを目的としています。 潜在的連続体上の位置が、合格と単位が最も授与される可能性のある連続体上の領域間の閾値にある人物 A について考えてみましょう。 また、単位と優等生が最も授与される可能性のある領域間の閾値にある人物 B についても考えてみましょう。Andrich (2005 、p. 25)が検討した例では、無秩序な閾値を文字通りに受け取ると、人物 A の位置 (合格/単位閾値) が人物 B の位置 (単位/優等閾値) よりも高いことを意味します。つまり、文字通りに受け取ると、無秩序な閾値の位置は、合格/単位閾値に達するには、単位/優等閾値に達するために必要な達成レベルよりも高いレベルを示す必要があることを意味します。明らかに、これはこのような評価システムの意図に反しています。したがって、閾値の無秩序は、成績の授与方法が評価システムの意図と一致していないことを示しています。つまり、無秩序は、成績が増加するパフォーマンスの順序付けられた分類を表すという評価システムの暗黙の仮説が経験的データの構造によって実証されていないことを示しています。

参考文献