基準参照テストとは、テストの得点を用いて、その得点を持つ人に期待される行動に関する記述を生成するテスト形式のことです。学校の教師が作成するテストや小テストのほとんどは、基準参照テストとみなすことができます。この場合、目的は生徒が教材を学習したかどうかを確認することだけです。基準参照評価は、規範参照評価やイプサティブ評価と対比されます。
基準参照テストは1970年代の心理測定研究の主要な焦点であった。 [ 1 ]
この用語に関してよくある誤解は、基準の意味です。基準参照型テストの多くは、カットスコア(合格点)を伴い、受験者はカットスコアを上回れば合格、下回れば不合格となります(多くの場合、習熟度テストと呼ばれます)。ここで言う基準とはカットスコアではなく、テストで評価対象となる科目の領域です。例えば、基準は「学生は2つの1桁の数字を正しく足し算できる」であり、カットスコアは合格するには学生が少なくとも80%の質問に正答しなければならない、というものです。
テストスコアの基準参照解釈は、科目との関係性を明確にするものです。習熟度テストの場合、これは受験者が特定の科目レベルを「習得」したかどうかを、スコアをカットスコアと比較することで特定することを意味します。しかし、すべての基準参照テストにカットスコアがあるわけではなく、カットスコアは単に科目領域における個人の地位を示す場合もあります。[ 2 ] ACTはその一例です。カットスコアはなく、高校レベルの科目に関する生徒の知識を評価するものです。
このよくある誤解のため、基準参照テストは、一部の教育機関によって基準に基づく評価とも呼ばれています。 [ 3 ]生徒は、州によって定義された、生徒が「知っておくべき」ことを定義した基準に照らして評価されるためです。[ 4 ]
| 生徒の回答 | 基準参照評価 | 規範参照評価 |
|---|---|---|
| 学生 1: 第二次世界大戦はヒトラーとドイツがポーランドに侵攻したことが原因でした。 | この答えは正解です。 | この回答は学生 #2 の回答より悪いですが、学生 #3 の回答よりは良いです。 |
| 学生2: 第二次世界大戦は、大恐慌と経済全般の状況、ナショナリズム、ファシズム、帝国主義的拡張主義の台頭、第一次世界大戦に関連する未解決の恨みなど、さまざまな要因によって引き起こされました。ヨーロッパでの戦争は、ドイツによるポーランド侵攻から始まりました。 | この答えは正解です。 | この回答は、学生 #1 と学生 #3 の回答よりも優れています。 |
| 学生3: 第二次世界大戦はフェルディナンド大公の暗殺によって引き起こされました。 | この答えは間違っています。 | この回答は、学生 1 号と学生 2 号の回答よりも悪いです。 |
基準参照型と規範参照型の両方の用語は、もともとロバート・グレイザーによって造られた。[ 5 ]基準参照型テストとは異なり、規範参照型テストは、受験者が他の受験者よりも成績が良かったか悪かったかを示す。例えば、基準が「生徒は2つの1桁の数字を正しく足し算できるべきである」である場合、妥当なテスト問題は「」や「」のようになるだろう。基準参照型テストは、個々の生徒がこれらの質問に正しく答えたかどうかに厳密に従って、生徒の成績を報告します。規範参照型テストは、主にこの生徒がグループ内の他の生徒と比較してより多くの質問に正しく答えたかどうかを報告します。同様のトピックをテストする場合でも、習熟度を正確に評価するように設計されたテストでは、相対的な順位付けを示すことを目的としたテストとは異なる問題が使用される場合があります。これは、生徒の実際の達成度を反映するのに優れた問題と、最も優秀な生徒と最も成績の悪い生徒を区別するのに優れた問題があるためです。 (多くの問題はその両方を行います。)基準参照型テストでは、特定の教材を理解している学生が正しく解答した問題が使用されます。規範参照型テストでは、「最も優秀な」学生が正しく解答し、「最も成績の悪い」学生が正しく解答しなかった問題が使用されます(例:ケンブリッジ大学の入学前「S」試験)。テストによっては、実際の成績と相対的な順位の両方について有用な情報を提供するものもあります。ACTは、順位と、大学で成功するために必要とされるレベルの両方を示します。[ 6 ]「基準参照型テスト」という用語は、テスト自体だけでなく、スコアの解釈にも言及する可能性があるため、誤用であると主張する人もいます。 [ 7 ]前の例では、ACTの同じスコアは、規範参照型または基準参照型の方法で解釈できます。
ドメイン参照テストは基準参照テストに似ており、特定の学習分野を網羅した評価であり、スコアによってその分野の習得度合いが明らかになります。例えば、ドメイン参照テストまたは基準参照テストで90%の項目に正解した場合、それはその受験者がテストで扱われる内容について深い知識と理解を持っていることを示す高いスコアとなります。これらのテストは、基準参照テストとは対照的です。基準参照テストでは、スコアは受験者が他の受験者と比較してどの程度の成績を収めたかを示します。[ 8 ] [ 9 ]
多くの注目度の高い基準参照型テストは、ハイステークステスト(高利害試験)でもあり、その試験結果は受験者個人にとって重要な意味を持ちます。例えば、高校卒業試験や免許試験など、パイロットや弁護士など、専門職に就くためには合格が必須となる試験が挙げられます。しかし、ハイステークステストであることは、基準参照型テスト特有の特徴ではありません。むしろ、教育機関や政府機関が試験結果をどのように活用するかという点に特徴があります。さらに、これは個別の試験形態でもあります。