2017年からのロゴ | |
| タイプ | コンピュータベースの標準テスト |
|---|---|
| 管理者 | カレッジボード、教育テストサービス |
| テストされるスキル | ライティング、批判的読解、数学 |
| 目的 | 大学または短期大学の学部課程への入学 |
| 年が始まった | 1926 (1926年) |
| 間隔 | 2時間14分[ 1 ] |
| スコア範囲 | テストは2つのセクション(合計400~1600点)それぞれについて、200~800点(10点刻み)で採点されます。エッセイは3つの基準それぞれについて、2~8点(1点刻み)で採点されます。 |
| 提供 | 年8回[ a ] |
| 地域 | 全世界[ 3 ] |
| 言語 | 英語 |
| 年間受験者数 | |
| 前提条件 | 公式の前提条件はありません。高校生を対象としています。英語が堪能であることが前提となります。 |
| 手数料 | 国によって60ドルから108ドル。[ 5 ] |
| 使用者 | 米国の学部課程を提供するほとんどの大学 |
| Webサイト | sat |
SAT ( / ˌ ɛ s . ˌ eɪ . ˈ t iː /SAT( SAT: SAT I: SAT Reasoning Test)は、アメリカ合衆国の大学入学選考で広く用いられている標準テスト。1926年の導入以来、名称と採点方法は何度か変更されています。当初はScholastic Aptitude Test(学力試験)言語能力と数学能力の2つの要素で構成され、それぞれ200点から800点の範囲で採点されました。その後、Scholastic Assessment Test(学力評価試験)、SAT I: Reasoning Test(推論試験)、SAT Reasoning Test(推論試験)、そして単にSAT。
SATはカレッジボードが100%所有、開発、発行しており、教育試験サービス( ETS)が管理している。[ 6 ]このテストは、学生の大学進学準備状況を評価するためのものである。歴史的に、1937年頃から、SATの名称で提供されていたテストには、選択科目別のSAT Subject Testsも含まれていた。これは1993年まではSAT Achievement Tests、その後2005年まではSAT II: Subject Testsと呼ばれていたが、2021年6月以降は廃止されている。[ 7 ] [ 8 ]もともと高校のカリキュラムに沿わないよう設計されたが、[ 9 ] 2016年に導入されたバージョンのSATではいくつかの調整が行われた。カレッジボードのデビッド・コールマン会長は、新しいコモン・コア基準で高校で生徒が学ぶ内容をより正確に反映させたいと付け加えた。[ 10 ]
多くの学生は、様々な企業や団体が提供する書籍、授業、オンラインコース、個別指導を利用してSATの準備をします。しかし、(高額な)準備コースでは成績が大幅に向上することはなく、 [ 11 ]エリート中等学校も同様です。[ 12 ] [ 13 ]かつて、SATは紙で受験されていました。しかし、2023年3月から留学生は、2024年3月から米国内の学生はBluebookと呼ばれるコンピュータープログラムを使用してSATが実施されます。[ 14 ] [ 15 ]また、このテストは適応型になり、学生に提示される問題は、テストの前半で出題された問題の成績に基づいてカスタマイズされ、試験時間は3時間から2時間14分に短縮されました。[ 1 ] [ 16 ]
SATについてはかなりの研究が行われてきましたが、多くの疑問や誤解が残っています。[ 17 ] [ 18 ]大学入学以外では、SATは人間の知能全般、特に知的早熟を研究する研究者によっても利用されています。 [ 19 ] [ 20 ] [ 21 ]また、一部の雇用主は採用プロセスでSATを利用しています。[ 22 ] [ 23 ] [ 24 ]
SATは通常、高校3年生と4年生が受験します。[ 25 ]カレッジボードは、SATは大学での学業成績向上に必要な読解力、計算力、ライティング力を測定することを目的としていると述べています。また、SATは受験者が問題を分析・解決する能力、つまり学校で学んだスキルを大学でどれだけうまく身につけられるかを評価するものであると述べています。
カレッジボードはまた、SATと高校の成績平均点(GPA)を組み合わせることで、大学1年生のGPAで測られる高校の成績のみよりも、大学での成功をより正確に測る指標となると主張しています。SAT導入以来実施された様々な研究では、SATを考慮すると高校の成績と大学1年生の成績の相関が統計的に有意に高まることが示されています。 [ 26 ] SATの予測妥当性と検出力は、心理測定学の研究対象となっています。[ 17 ]
SATは、受験者の間でベルカーブ分布に従うスコアを得ることを目的とした規範参照型テストです。この分布を実現するために、テスト作成者は、妥当ではあるものの誤った選択肢(「ディストラクター」と呼ばれる)を含む難しい多肢選択問題を組み込み、大多数の受験者が正答する問題を除外し、試験中に厳しい時間制限を設けています。[ 27 ]
アメリカの中等学校は、連邦制、地方自治、そして私立、遠隔教育、自宅学習の生徒の多さから、資金、カリキュラム、成績、難易度において大きな差があります。SAT(およびACT)のスコアは、中等学校の成績を補完し、入学審査官がコースワーク、成績、学年順位といった地域データを全国的な視点で捉えるのに役立つことを目的としています。[ 28 ]
歴史的に、SATは沿岸州に住む学生に広く使用され、ACTは中西部と南部の学生に広く使用されていましたが、近年では東海岸と西海岸でACTを受験する学生の数が増加しています。[ 29 ] [ 30 ] 2007年以降、入学申請の一部としてテストを必要とする米国の4年制大学はすべて、SATまたはACTのいずれかを受け入れるようになり、2022年秋時点で、1400以上の4年制大学が入学に標準化テストのスコアをまったく要求していませんが、そのうちのいくつかはコロナウイルスのパンデミックのために一時的にのみこのポリシーを適用することを計画していました。[ 31 ] [ 32 ]
SAT受験者には試験時間として2時間14分が与えられます(リーディング・ライティングセクションと数学セクションの間には10分の休憩があります)[ 33 ]。2024年現在、試験料は60ドルで、これに加えて、遅れた試験登録、電話による登録、登録変更、結果の迅速な送付、4つ以上の機関への結果の送付、試験後9日以上経過してからの結果送付、および米国外で実施される試験(該当する場合)には追加料金がかかります。また、米国およびその領土内の低所得の学生には料金免除が提供されています。[ 34 ] [ 35 ] [ 36 ] SATの点数は400~1600点で、数学セクションとエビデンスに基づくリーディング・ライティングセクションの2つのセクション(200~800点)の試験結果を組み合わせます。アメリカの多くの大学では、新入生入学にSATやその競合試験であるACTの受験が必須となっているが[ 37 ]、2010年代後半には多くの教育機関がこれらの入学試験を任意とした。[ 38 ] [ 39 ] [ 40 ]しかし、学生たちは高得点を目指して努力を続けた。 [ 41 ]学生たちもその親たちも、この文脈における「任意」の意味に懐疑的だった。[ 42 ]実際、受験者数は着実に増加しており[ 43 ]、これが長期的には得点の低下を招いた可能性もあるが[ 43 ] [ 44 ] [ 45 ]専門家は、これを全米の学力レベルを測る指標として用いることに対して警告を発している。[ 45 ]
スコアは通常、試験の2~4週間後に発表されます。SAT週末試験は通常2週間後に発表されますが、SATの学校日はより変動が激しいです。[ 46 ]学生は試験後1週間までスコアをキャンセルできる場合があります。[ 47 ]
現在デジタルで実施されているSATは、リーディングとライティング、そして数学の2つの主要セクションで構成されています。各セクションはさらに、同じ長さの2つの「モジュール」に分割されています。(2021年夏までは、受験者は追加テストセクションの一部としてエッセイを任意で受験することができました。エッセイは2021年6月以降、一部の州と学区を除き廃止されました。[ 48 ])SATの採点セクションの試験時間は合計2時間14分です。[ 1 ]
各セクションの得点は200点から800点の範囲で算出され、各セクションの得点は10の倍数です。SATの総合点は2つのセクションの得点を合計して算出され、合計得点は400点から1600点の範囲となります。2つのセクションの得点に加えて、各セクションではいくつかのサブセクションの「パフォーマンス」スコア(例えば、リーディングとライティングの「構成と技法」、数学の「代数」など)も報告されます。SATでは、推測によるペナルティや減点はありません。得点は正答数に基づいて算出されます。[ 49 ] [ 50 ]
SATスクールデーで実施されるエッセイは、2つのセクションのスコアとは別に採点されます。[ 51 ] [ 52 ]各エッセイは、2人の採点者が、読解、分析、ライティングの3つのカテゴリーそれぞれに1~4点を付与することで採点されます。[ 53 ]異なる採点者によるこれらの2つのスコアは、各カテゴリーごとに2~8点の合計スコアとして算出されます。エッセイのスコアを24点満点で引用する人もいますが、カレッジボード自体は、各カテゴリーを1つのエッセイスコアとして統合するのではなく、各カテゴリーごとにスコアを算出しています。
選択科目のエッセイが全国的に導入されたのは、2021年6月実施の試験が最後でした。[ 7 ] [ 8 ]カレッジボードは、エッセイセクションを廃止した理由として、「学生がエッセイライティングの習熟度を示す方法は他にもあり、それには試験のリーディングとライティングの部分も含まれる」と述べました。[ 7 ] [ 8 ]また、COVID-19パンデミックがこの変更に影響を与え、「すでに進行中のプロセス」を加速させたことも認めました。[ 8 ]
リーディング・ライティングセクションは、それぞれ32分間で27問の同じ内容の2つのモジュールで構成されています。[ 6 ]モジュールは短い読解文章または文章のペアで構成され、各文章の後に多肢選択式問題が1問出題されます。文章の長さは25語から150語です。リーディング・ライティングセクションの出題範囲には、語彙、文の構造と用法、表とグラフの解釈などが含まれます。[ 54 ]

SATの数学パートは2つのモジュールに分かれており、各モジュールは35分間で22問が出題されます。[ 1 ]扱われるトピックは、代数(13~15問)、高校上級数学(13~15問)、問題解決とデータ分析(5~7問)、幾何学と三角法(5~7問)です。[ 55 ]数学の問題の約75%は4択の多肢選択式で、残りの25%は生徒作成解答(SPR)問題であり、生徒は数値を入力して解答する必要があります。SPR問題には複数の正解がある場合があります。[ 56 ] SATの数学パートのすべての問題で電卓の使用が許可されています。Desmosベースの電卓が利用可能で、テストソフトウェアに組み込まれています。また、承認されたタイプの物理的な電卓を使用することもできます。[ 57 ]
SAT I:推論テストにおける電卓の使用に関する調査では、数学セクションの成績は電卓の使用頻度と関連していることが判明しました。電卓を使用した科目は全体の約3分の1から半分であり、使用頻度が高かったり低かったりする生徒よりも平均点が高かったのです。しかし、この影響は「電卓の使用そのものよりも、優秀な生徒とそうでない生徒の電卓の使い方の違いによるものである可能性が高い」とのことです。[ 58 ]学校でテスト以外で頻繁に電卓を使用すると、学校で電卓を使用しない生徒と比較して、テストの成績にプラスの影響を与えるという証拠がいくつかあります。[ 59 ]
SATの設問のほとんどは、数学セクションのSPR(Student-produced response)を除き、多肢選択式です。すべての多肢選択式設問には4つの選択肢があり、そのうち1つが正解です。数学セクションの約25%がSPRです。SPRでは、受験者は数字を入力する必要があります。[ 60 ]
SATの各セクションのすべての問題が均等に配分されているわけではなく、より難しい問題に正答することで、学生はより高い得点を獲得します。[ 61 ]カレッジボードは、将来の試験問題をテストするために実験問題を使用しています。実験問題への回答は、正答か誤答かにかかわらず、試験の得点に影響を与えません。実験問題は、将来のSATにおける新しいタイプの問題を評価するために使用されます。[ 62 ]
| セクション[ 63 ] | 平均スコア 2025 (200–800) [ 4 ] | 時間(分) | コンテンツ |
|---|---|---|---|
| 読み書き | 521 | モジュールあたり32 合計64 | 語彙、批判的読解、文章レベルの読解、文法、語法、語彙 |
| 数学 | 508 | モジュールあたり35 合計70 | 数と演算、代数と関数、幾何学、統計、確率、データ分析 |
SATは現在、世界中で年に8回、8月、9月、10月、11月、12月、3月、5月、6月に実施されています。[ 3 ]当初、留学生向けにSATは年に4回、10月、12月、3月、5月に実施されていました(2020年の例外:世界中で5月の試験が中止されたことを補うために、9月の試験が追加され、8月も留学生が受験できるようになりました)。[ 64 ]試験は通常、10月、11月、12月、5月、6月の実施で、毎月第1土曜日に実施されます。[ 3 ]この試験は、2025年度入学生2,004,965人が受験しました。[ 4 ]
試験の受験を希望する受験者は、試験日の少なくとも 3 週間前までに、College Board の Web サイトでオンライン登録するか、郵送で登録することができます。
在学中にSATを受験する生徒のために、SATスクールデーテストもあります。[ 65 ]これは3月から4月と10月に実施されます。[ 66 ]
2024年現在、SATの受験料は68ドルで、米国外で受験する場合は追加料金がかかります。[ 34 ]カレッジボードは低所得の学生に対して受験料免除を提供しています。ただし、遅延登録、スタンバイテスト、登録変更、電話によるスコア取得、追加スコアレポート(無料で提供される4回分以外)には追加料金がかかります。
身体障害や学習障害など、証明可能な障害を持つ学生は、特別な配慮を受けてSATを受験できます。学習障害または身体障害のために追加時間を必要とする学生の場合、標準の試験時間延長は50%ですが、100%の延長も可能です。
2022年1月、カレッジボードはSATを紙ベースからデジタル(コンピュータベース)に変更すると発表しました。[ 14 ]国際(米国以外)のテストセンターは、2023年3月11日からデジタル形式の使用を開始しました。2023年12月のSATが紙で実施される最後のSATテストとなりました。米国では、2024年3月9日にデジタル形式への移行が行われました。[ 67 ]デジタルSATは、紙ベースのテストよりも約1時間短縮されます(2時間対3時間)。これまでと同様に公式テストセンターで実施されますが、受験者は各自のテストデバイス(ポータブルコンピューターまたはタブレット)を使用します。ただし、大学によっては、キャンパス内でデジタルSATを受験する学生に学校支給のデバイスの使用を求める場合があります。学生が自分のデバイスを持参できない場合は、カレッジボードにデバイスを申請できます。[ 68 ]テスト前に、カレッジボードの「Bluebook」アプリをテストデバイスにインストールしておく必要があります。[ 69 ]
学生はセクションごとに2つのモジュール(リーディング/ライティングと数学)を受験します。リーディングとライティングのモジュールでは、設問ごとに短い文章が用いられます。数学のモジュールでは、文章問題はより簡潔になります。学生は最初の2つの英語モジュールの後、2つの数学モジュールの前に10分間の休憩を取ります。試験ソフトウェアにはタイマーが組み込まれており、学生が2番目の英語モジュールを終えると自動的に開始されます。デジタルSATには、質問フラグ、タイマー、Desmos搭載のグラフ電卓などの新しいツールが搭載されています。[ 70 ]
新しいテストは適応型で、第2モジュールは第1モジュールの結果に基づいて、実証されたレベルに合わせて調整されます。具体的には、各セクションにおけるモジュール2の難易度は、モジュール1の成績によって決定されます。第1モジュールで高い成績を収めた場合は、より難易度の高いモジュール2に進級します。モジュール2には、テストで最も難しい問題が含まれています。成績が低い場合は、より難易度の高いモジュール2に進級します。難易度の高い読解モジュールには、高度に学術的で修辞的に複雑な短い文章が含まれることが多く、難易度の高い数学モジュールでは、より抽象的で高度な概念や問題に焦点を当てています。
学生は、試験実施後約2~4週間でオンラインスコアレポートを受け取ります(郵送の紙のスコアの場合はさらに長くなります)。[ 71 ]レポートには、合計スコア(2つのセクションのスコアの合計で、各セクションは200~800のスケールで採点されます)と、オプションのエッセイの3つのサブスコア(リーディング、ライティング、分析で、それぞれ2~8のスケール)が含まれます。[ 72 ]学生は、追加料金でスコア検証サービスも受けることができます。テスト問題、学生の回答、正解、各問題の種類と難易度を提供する質問と回答サービス[ 73 ]は、デジタルSATでは利用できません。[ 74 ]
さらに、学生は2つのパーセンタイルスコアを受け取ります。これらはそれぞれ、比較グループ内の同等またはそれ以下のテストスコアを持つ学生の割合として、カレッジボードによって定義されています。1つのパーセンタイルは「全国代表サンプルパーセンタイル」と呼ばれ、SAT受験の有無にかかわらず、米国の11年生と12年生全員を比較グループとして使用します。このパーセンタイルは理論的なものであり、統計的推論手法を用いて算出されます。2つ目のパーセンタイルは「SATユーザーパーセンタイル」と呼ばれ、最近SATを受験した米国の学生の比較グループの実際のスコアを使用します。例えば、2019~2020年度のSATユーザーパーセンタイルは、高校時代にSAT(具体的には2016年改訂版)を受験した2018年と2019年の卒業生のテストスコアに基づいています。学生は、合計スコアとセクションスコアの両方のパーセンタイルを受け取ります。[ 72 ]
| スコア、400~1600スケール | SATユーザー | 全国代表サンプル |
|---|---|---|
| 1600 | 99+ | 99+ |
| 1550 | 99 | 99+ |
| 1500 | 98 | 99 |
| 1450 | 96 | 99 |
| 1400 | 93 | 97 |
| 1350 | 90 | 94 |
| 1300 | 86 | 91 |
| 1250 | 81 | 86 |
| 1200 | 75 | 81 |
| 1150 | 68 | 74 |
| 1100 | 60 | 67 |
| 1050 | 51 | 58 |
| 1000 | 43 | 48 |
| 950 | 35 | 38 |
| 900 | 27 | 29 |
| 850 | 19 | 21 |
| 800 | 13 | 14 |
| 750 | 7 | 8 |
| 700 | 3 | 4 |
| 650 | 1 | 1 |
| 640~400 | 1- | 1- |
以下の表は、2005年3月から2016年1月にかけて実施されたSATのバージョンで使用された元のパーセンタイルをまとめたものである。これらのパーセンタイルは、2006年度卒業生を比較グループとして使用した。[ 76 ] [ 77 ]
| パーセンタイル | スコア400~1600スケール(公式、2006年) | スコア、600~2400スケール(公式、2006年) |
|---|---|---|
| 99.93/99.98* | 1600 | 2400 |
| 99.5 | ≥1540 | ≥2280 |
| 99 | ≥1480 | ≥2200 |
| 98 | ≥1450 | ≥2140 |
| 97 | ≥1420 | ≥2100 |
| 93 | ≥1340 | ≥1990 |
| 88 | ≥1280 | ≥1900 |
| 81 | ≥1220 | ≥1800 |
| 72 | ≥1150 | ≥1700 |
| 61 | ≥1090 | ≥1600 |
| 48 | ≥1010 | ≥1500 |
| 36 | ≥950 | ≥1400 |
| 24 | ≥870 | ≥1300 |
| 15 | ≥810 | ≥1200 |
| 8 | ≥730 | ≥1090 |
| 4 | ≥650 | ≥990 |
| 2 | ≥590 | ≥890 |
| *満点のパーセンタイルは、2400 スケールでは 99.98、1600 スケールでは 99.93 でした。 | ||
| スコア(1984) | パーセンタイル |
|---|---|
| 1600 | 99.9995 |
| 1550 | 99.983 |
| 1500 | 99.89 |
| 1450 | 99.64 |
| 1400 | 99.10 |
| 1350 | 98.14 |
| 1300 | 96.55 |
| 1250 | 94.28 |
| 1200 | 91.05 |
| 1150 | 86.93 |
| 1100 | 81.62 |
| 1050 | 75.31 |
| 1000 | 67.81 |
| 950 | 59.64 |
| 900 | 50.88 |
| 850 | 41.98 |
| 800 | 33.34 |
| 750 | 25.35 |
| 700 | 18.26 |
| 650 | 12.37 |
| 600 | 7.58 |
| 550 | 3.97 |
| 500 | 1.53 |
| 450 | 0.29 |
| 400 | 0.002 |
| スコア、200~800点満点 | 言語SATユーザー | 口頭、全国代表サンプル | 数学SATユーザー、男子 | 数学SATユーザー、女子 |
|---|---|---|---|---|
| 800 | 99+ | 99+ | 99+ | 99+ |
| 750 | 99+ | 99+ | 99 | 99+ |
| 700 | 98 | 99+ | 95 | 99 |
| 650 | 95 | 98 | 89 | 96 |
| 600 | 89 | 95 | 78 | 89 |
| 550 | 79 | 90 | 65 | 79 |
| 500 | 66 | 82 | 48 | 63 |
| 450 | 50 | 72 | 33 | 46 |
| 400 | 33 | 58 | 20 | 29 |
| 350 | 18 | 44 | 11 | 16 |
| 300 | 7 | 28 | 4 | 6 |
| 250 | 2 | 14 | 1 | 1 |
| 200 | 1− | 4 | 1− | 1− |
SATを受験した生徒の平均言語スコアは461点、全生徒のサンプルでは383点でした。[ 79 ]
1969年から1970年までの数学の点数は、全体として報告されるのではなく、性別ごとに分類されており、男子の平均数学の点数は415点、女子は378点であった。全国的に抽出された母集団における数学の点数の違い(表には示されていない)は、言語セクションの場合と同様であった。[ 79 ]
1995年4月以前に実施されたSATの得点上限は非常に高く、例えば1985年から1986年の学年度では、170万人の受験者のうち1600点を獲得したのはわずか9人でした。[ 80 ]
2015年度のクラスの平均点は、最高点2400点中1490点でした。これは前年度より7点下がり、過去10年間で最も低い総合点となりました。[ 44 ]
カレッジボードとACT社は、2004年9月(ACT)または2005年3月(SAT)から2006年6月までの間にSATとACTの両方を受験した学生を対象に共同研究を実施しました。2005年1月以降から2016年3月までにSATを受験した学生のスコアを照合するための表が提供されました。[ 81 ] [ 82 ] 2016年5月、カレッジボードは、2005年3月から2016年1月まで使用されたSATのスコアと2016年3月以降使用されたSATのスコアを照合する表、および2016年3月以降に使用されたSATのスコアとACTのスコアを照合する表を発表しました。[ 83 ]
2018年、カレッジボードはACTと提携して、学生が各テストでどのように成績を上げるかをよりよく比較するための新しいコンコーダンス表を導入しました。[ 84 ]これは現在、大学の専門家が使用する公式コンコーダンスとみなされており、2016年のものに取って代わります。新しいコンコーダンスには、古いSAT(2,400点満点)は含まれておらず、新しいSAT(1,600点満点)とACT(36点満点)のみが含まれています。
2018年現在、与えられたACTスコアに最も適したSATスコアポイントも以下の表に示されています。[ 85 ]
| ACT総合スコア | SAT合計スコア範囲 | SAT合計スコア |
|---|---|---|
| 36 | 1570–1600 | 1590 |
| 35 | 1530–1560 | 1540 |
| 34 | 1490–1520 | 1500 |
| 33 | 1450–1480 | 1460 |
| 32 | 1420–1440 | 1430 |
| 31 | 1390–1410 | 1400 |
| 30 | 1360–1380 | 1370 |
| 29 | 1330–1350 | 1340 |
| 28 | 1300~1320年 | 1310 |
| 27 | 1260–1290 | 1280 |
| 26 | 1230–1250 | 1240 |
| 25 | 1200~1220年 | 1210 |
| 24 | 1160–1190 | 1180 |
| 23 | 1130–1150 | 1140 |
| 22 | 1100~1120年 | 1110 |
| 21 | 1060–1090 | 1080 |
| 20 | 1030~1050年 | 1040 |
| 19 | 990–1020 | 1010 |
| 18 | 960–980 | 970 |
| 17 | 920–950 | 930 |
| 16 | 880–910 | 890 |
| 15 | 830–870 | 850 |
| 14 | 780~820年 | 800 |
| 13 | 730~770年 | 760 |
| 12 | 690~720年 | 710 |
| 11 | 650~680年 | 670 |
| 10 | 620~640年 | 630 |
| 9 | 590–610 | 590 |
1946年にスタンレー・カプランが64時間コースで開拓して以来、 [ 86 ] SAT対策は非常に利益の高い分野となっている。[ 87 ]多くの企業や団体が、書籍、クラス、オンラインコース、個別指導の形でテスト対策を提供している。[ 88 ]テスト対策産業は、米国で大学入試が導入されたのとほぼ同時に始まり、当初から繁栄した。[ 89 ]テスト対策詐欺は、親と生徒にとって真の問題である。[ 90 ]一般的に、東アジア系アメリカ人、特に韓国系アメリカ人は、民間のSAT対策コースを受講する可能性が最も高いが、アフリカ系アメリカ人は、補習学習のためにマンツーマンの個別指導に頼ることが多い。[ 91 ]
それにもかかわらず、カレッジボードはSATは本質的にコーチング不可能であると主張しており、カレッジボードと全米大学入学カウンセリング協会の調査では、個別指導コースによって数学セクションで平均約20ポイント、言語セクションで平均約10ポイントのスコアアップが得られると示唆しています。[ 92 ]実際、研究者は準備コースがテストのスコアをせいぜいわずかに上げる傾向があることを繰り返し示しています。[ 93 ] [ 94 ] [ 95 ] IQスコアと同様に、SATスコアは時間の経過とともに安定する傾向があるため、SAT準備コースが提供するメリットは限られています。[ 11 ]初期のメタ分析(1983年)でも同様の結果が見つかり、「マッチング研究またはランダム化研究から推定されたコーチング効果のサイズ(10ポイント)は、実際には重要になるには小さすぎるようです」と指摘されました。[ 96 ]統計学者ベン・ドミンゲとデレク・C・ブリッグスは、2002年の教育縦断調査のデータを調べ、コーチングの効果が統計的に有意だったのは数学のみであり、さらに、コーチングは特定の生徒、特に厳しいコースを受講した生徒や高い社会経済的地位にある生徒に他の生徒よりも大きな影響を与えたことを発見した。[ 97 ] 2012年の体系的な文献レビューでは、数学と言語のテストでそれぞれ23点と32点のコーチング効果が推定された。[ 89 ] 2016年のメタ分析では、言語と数学のセクションでそれぞれ効果サイズが0.09と0.16と推定されたが、かなりの異質性があった。[ 98 ]一方、2011年の研究では、一対一の個別指導の効果はすべての民族グループで最小限であることが判明した。[ 91 ] SATの準備方法に関する一般の誤解は、準備業界によって引き続き利用されている。[ 17 ]
家庭環境とSAT対策コースの受講には関連性があるものの、すべての学生がそのような投資から平等に恩恵を受けるわけではありません。実際、SAT対策コースによる平均的なSATスコアの向上は、主に東アジア系アメリカ人の成績向上によるものです。[ 99 ]このグループをさらに細分化すると、韓国系アメリカ人は中国系アメリカ人よりもSAT対策コースを受講する傾向が高く、教会コミュニティと民族経済を最大限に活用しています。[ 100 ]
カレッジボードは、非営利団体カーンアカデミーと提携し、低所得世帯の学生の受験環境を平等にするために、2015-16年度から無料の試験準備教材を提供すると発表した。[ 101 ] [ 44 ]また、カレッジボードのより手頃な価格の公式ガイドとしっかりとした学習習慣があれば、学生は高額な準備プログラムに頼る必要がなくなるかもしれない。[ 102 ]
カレッジボードは、Preliminary SAT/National Merit Scholarship Qualifying Test(PSAT/NMSQT)というテストも提供しており、少なくとも1回はPSATを受験すると、学生がSATでより良い成績を収めるのに役立つという証拠がいくつかあります。[ 103 ]さらに、SATの場合と同様、PSATでトップスコアを獲得すると奨学金を獲得できます。[ 42 ]認知科学者のシアン・ベイロックによると、SATを受けるなどの重要な機会での「チョーキング」、つまり標準以下のパフォーマンスは、手続き記憶を向上させるために多くの練習問題と監督付き試験をこなすこと、作業記憶の過負荷を避けるために途中のステップを書き留める小冊子を活用すること、自己共感と肯定的な自己イメージを高めるために試験当日に不安について日記をつけること、によって防ぐことができます。[ 104 ]試験前の数日間の睡眠の質はパフォーマンスを向上させることができるため、睡眠衛生は重要です。さらに、10代の若者の体内時計の変化に適した遅い授業時間(午前7時半ではなく午前8時半)は、SATのスコアを十分に上げ、入学できる大学のレベルを変える可能性があることが示されています。[ 105 ] [ 106 ]
COVID-19パンデミックを受けて、多くのアメリカの大学は、入学希望者に対し標準テストのスコア提出を任意とすることを決定しました。しかし、多くの学生は依然としてSATを受験し、対策プログラムに参加しており、これらのプログラムは依然として収益性が高いものでした。[ 107 ]
2009年、カリフォルニア大学(UC)システムの教育研究者リチャード・C・アトキンソンとソール・ガイザーは、高校の種類や質に関わらず、高校のGPAはSATよりも大学の成績を予測する上で優れていると主張した。[ 108 ] UC学術評議会は2020年の報告書で、SATは高校1年生のGPAを予測する上で高校GPAよりも優れており、学部GPA、1年生の留年率、卒業率の予測では高校GPAと同等の精度があると結論付けた。この予測妥当性は人口統計学的グループ全体で維持され、報告書では標準化テストのスコアは実際には「過小評価されたマイノリティ学生(URM)、第一世代、または低所得世帯の学生にとって、成功のより良い予測因子である」と指摘されている。[ 109 ]カレッジボードの一連の報告書は、人口統計学的グループ全体で同様の予測妥当性を示している。[ 110 ] [ 111 ]
しかし、カリフォルニア大学学術評議会の報告書から1か月後、ソール・ガイザー氏はカリフォルニア大学学術評議会の調査結果に異議を唱え、「評議会の主張は『虚偽』であり、予測モデルから学生の人口統計情報を除外するという根本的な誤りに基づいている」と述べた。ガイザー氏は、高校のGPAと人口統計情報を予測に組み合わせると、SATの信頼性が低下すると指摘した。UCLA教授で、国立評価・基準・学生テスト研究センター(National Center for Research on Evaluation, Standards, and Student Testing)の所長を務めるリー・カイ氏は、カリフォルニア大学学術評議会は一般の人々が理解しやすいように、より簡略化された異なるモデルを用いて学生の人口統計情報を組み込んでおり、SATの差別的影響は入学選考プロセスにおいて補正されていると述べた。カリフォルニア大学バークレー校の公共政策・経済学教授ジェシー・ロススタイン氏は、リー氏の主張に反論し、カリフォルニア大学学術委員会は「SATについて多くの点で誤解している」、SATの価値を過大評価している、「カリフォルニア大学入学選考委員会がグループ間のテストスコアの格差を『埋め合わせ』していると結論付ける根拠がない」と述べた。[ 112 ]しかし、ブラウン大学、イェール大学、ダートマス大学は、自らの機関データを分析した結果、SATのスコアはGPAよりも大学での成功を予測する上でより信頼性が高いという結論に達した。さらに、SATのスコアによって、恵まれない環境にある潜在的に優秀な学生を、そうでない場合よりも多く特定することができる。 [ 113 ]テキサス大学オースティン校では、SATのスコア提出が任意であったにもかかわらず提出を辞退した学生は、提出した学生よりも成績が悪かった。[ 113 ]これらの結果は、非営利団体オポチュニティ・インサイツがアイビーリーグの大学(ブラウン大学、コロンビア大学、コーネル大学、ダートマス大学、ハーバード大学、プリンストン大学、ペンシルベニア大学、イェール大学)に加え、スタンフォード大学、マサチューセッツ工科大学、シカゴ大学のデータを分析した研究でも再現された。[ 114 ] [ 113 ] 2009年の研究では、SATまたはACTのスコアと高校のGPAは、大学の累積GPAの強力な予測因子であることが判明した。特に、標準テストのスコアが50パーセンタイル以上である人は、大学の累積GPAが上位半分に入る可能性が3分の2であった。[ 115] [ 18 ]ミネソタ大学の研究者による2010年のメタ分析は、SATなどの標準化された入学試験が新入生のGPAだけでなく大学全体のGPAも予測するという証拠を示しました。 [ 116 ] [ 11 ]同じ大学が複数の機関のデータセットを使用して2012年に実施した研究では、社会経済的地位と高校のGPAをコントロールした後でも、SATのスコアは大学生や短大の学生の間で新入生のGPAを予測する能力があることが明らかになりました。 [ 117 ]約25万人の学生を対象とした2019年の研究では、SATのスコアと高校のGPAを合わせると、大学1年生のGPAと2年目の留年を予測する優れた指標になることが示唆されています。 [ 17 ] 2018年に、心理学者のオーレン・R・シェワック、カイル・D・マクニール、ネイサン・R・クンセル、ポール・R・サケットは、高校のGPAとSATのスコアの両方が、アドバンストプレース。 [ 118 ] [ 17 ]
教育経済学者ジェシー・M・ロススタインは2005年、高校の平均SATスコアは、個人のSATスコアよりも大学1年生のGPAを予測する上で優れていると指摘した。言い換えれば、生徒のSATスコアは、高校の平均スコアほど将来の学業成績に関する情報を提供しないということである。対照的に、高校の個人のGPAは、高校の平均GPAよりも大学での成功をより正確に予測する指標であった。[ 119 ] [ 120 ]さらに、平均SATスコアを考慮に入れない入学審査官は、低得点校の生徒の将来の成績を過大評価し、高得点校の生徒の将来の成績を過小評価するリスクがある。[ 120 ]
SATは知能と相関関係があり、個人差を推定するものの、「効果的な認知能力」や知能の高い人の行動については何も言及していない。[ 17 ]また、肯定的な態度や誠実さなど、学業の成功に関連する非認知特性も測定していない。[ 17 ] [ 116 ]心理測定学者のトーマス・R・コイルとデビッド・R・ピローは2008年に、SATと高い相関関係にある一般因子である知能( g )を除いた後でも、SATは大学のGPAを予測できることを示した。[ 121 ]
ACTやGREといった他の標準テストと同様に、SATは、大きく異なる教育経験を持つ学生の学力を評価する伝統的な方法であり、学生が学習過程を通して遭遇すると合理的に予想される共通の教材に焦点を当てています。そのため、例えば数学セクションにはプレカルキュラスレベル以上の教材は含まれていません。心理学者レイモンド・キャッテルは、これを「現在の」結晶化知能ではなく「歴史的」結晶化知能のテストと呼びました。[ 122 ]心理学者スコット・バリー・カウフマンはさらに、SATは特定の瞬間における個人のパフォーマンスのスナップショットしか測定できないと指摘しました。[ 123 ]教育心理学者のジョナサン・ワイ、デビッド・ルビンスキー、カミラ・ベンボウは、SATの予測妥当性を高める方法の一つは、学生の空間的推論能力を評価することであると指摘しました。なぜなら、SATには現在、空間的推論能力に関する設問がないからです。空間的推論能力は、STEM分野での成功に重要です。[ 124 ]心理測定学者ロバート・スターンバーグが主導した2006年の研究では、SATのスコアと高校のGPAが大学での成績を予測する能力は、分析的思考力、創造的思考力、実践的思考力の追加評価によってさらに強化される可能性があることがわかりました。[ 125 ] [ 126 ]
実験心理学者のメレディス・フレイは、教育研究と神経科学の進歩により、将来の学業成績を予測する能力は徐々に向上する可能性があるものの、SATやその他の標準化されたテストは、今後も貴重なツールとして活用されるだろうと指摘した。[ 17 ] 2014年のニューヨーク・タイムズ紙の論説で、心理学者のジョン・D・メイヤーは、SATの予測力を「驚くべき成果」と呼び、SATやその他の標準化されたテストを任意にすることに対して警告した。[ 127 ] [ 18 ]心理測定学者のデビッド・ルビンスキー、カミラ・ベンボウ、および彼らの同僚による研究では、SATは大学卒業後の人生の結果を予測できることが示されている。[ 18 ]
SATは、学生の精神的スタミナ、記憶力、スピード、正確性、抽象的・分析的推論能力を厳密に評価します。[ 102 ]アメリカの大学では、標準化されたテストのスコアが入学において高校のGPAに次いで最も重要な要素です。[ 126 ]しかし、国際基準から見ると、SATはそれほど難しくありません。[ 128 ]例えば、韓国の大学修学能力試験(CSAT)とフィンランドの入学試験はどちらもより長く、より難しく、大学への入学資格により大きく影響します。[ 129 ]世界の多くの国では、大学入試を含む試験が入学の唯一の決定要因であり、学校の成績はまったく関係ありません。[ 128 ]中国とインドでは、それぞれ高考とインド工科大学入学資格試験(IIT-JEE)で良い成績をとることは、学生とその家族の社会的地位を高めます。 [ 130 ]
教育心理学者のジョナサン・ワイは2012年の論文で、SATは高校のGPAと標準テストのスコアで優秀な志願者が集まる競争の激しい大学にとって、あまりにも簡単すぎて役に立たないと主張した。そのため、入学審査官は、満点またはほぼ満点の学生の成績が本当に学力を反映しているのかどうかわからないまま、トップスコアの学生同士を区別する負担を負っていた。ワイは、カレッジボードがSATをより難しくすることを提案した。そうすれば、テストの測定範囲が広がり、トップ校は志願者の中で最も優秀な人材を見分けることができるようになるだろう。[ 131 ]当時、カレッジボードは既にSATの難易度を上げる作業を進めていた。[ 131 ]この変更は2014年に発表され、2016年に実施された。[ 132 ]
2018年6月の試験が例年よりも簡単だったことに気づいたカレッジボードは、調整を行った結果、予想よりも低い点数となり、学生から苦情が寄せられたが、公平性を保つためだったと認める者もいた。[ 133 ]プリンストン・レビューはこの事件の分析において、成績を曲線化するという考えを支持したが、この試験では数学で86パーセンタイル(650点)以上の学生を区別することができないと指摘した。また、プリンストン・レビューはこの特定の曲線は、成績優秀な学生の不注意や土壇場でのミスに対する緩衝材を提供しないという点で異常だとも指摘した。[ 134 ]プリンストン・レビューは2019年8月のSATについても同様のブログ記事を掲載したが、同様の事件が発生し、カレッジボードも同様の対応を示し、「簡単な試験で2問間違えた学生は、難しい試験で2問間違えた学生ほど良い点数を取るべきではない。等化によってその問題は解決される」と述べた。また、SATをすぐに再受験すると再び失望する可能性があるため、学生たちに警告し、代わりに再挑戦する前にある程度の「余裕」を持たせることを推奨した。[ 135 ]
カレッジボードは、2023~2024年度時点で、米国以外では約70カ国でSATが大学入学選考の基準になっていると主張している。[ 136 ]
2000年の研究で、心理測定学者のアン・M・ギャラガーとその同僚は、SATの数学セクションで遭遇した問題を解く際に直感的な推論を利用したのは成績上位の生徒だけであることを発見しました。 [ 137 ]認知心理学者のブレンダ・ハノンとメアリー・マクノートン・カシルは、優れたワーキングメモリ、知識統合能力、およびテスト不安の低さがSATでの高い成績を予測することを発見しました。[ 138 ]
FreyとDetterman(2004)は、SATスコアと知能検査スコアの関連性を調査した。Armed Services Vocational Aptitude Batteryに基づく一般的精神能力( g)の推定値を使用して、1979年の全国確率調査から抽出したサンプルにおいて、SATスコアがgと高い相関関係にあることを発見した(サンプルではr=.82、非線形性を調整すると.857)。さらに、彼らは、改訂され中心化された形式のテストを使用したSAT結果と、今度は非ランダムサンプルを使用した流動性知能(推論)のテストであるRaven's Advanced Progressive Matricesのスコアとの相関を調査した。彼らは、SAT結果とRaven's Advanced Progressive Matricesのスコアの相関は.483であることを発見した。彼らはまた、レイヴンのスコアに天井効果があるように見え、それが相関関係を抑制している可能性があることにも言及した。 [ 139 ]ボージャンとその同僚(2006)は、フレイとデッターマンが達したものと同様の結論に達している。[ 140 ] SATは一般知能と強く相関しているため、特に時間のかかる従来の評価方法が利用できない場合に、知能を測定するための代理指標として使用することができる。[ 17 ]
心理測定学者のリンダ・ゴットフレドソンは、SATは知的に優れた大学進学志望の学生を見極めるのに効果的であると指摘した。[ 141 ]
数十年にわたり、多くの批評家が、貧しい受験者と裕福な受験者の間の得点の差の原因として、SAT言語試験の設計者に文化的偏見があると非難してきた。 [ 142 ]最大の批判者はカリフォルニア大学システムからであった。[ 143 ] [ 144 ] SAT Iにおけるこの偏見の有名な例は、現在は試験の一部ではない、漕ぎ手とレガッタの類似問題である。この問題の目的は、「ランナー」と「マラソン」の関係に最も近い関係にある用語のペアを見つけることであった。正解は「漕ぎ手」と「レガッタ」であった。正解の選択は、学生が裕福な人々に人気のスポーツであるボート競技に精通していることを前提としていたと考えられている。 [ 145 ]しかし、心理測定学者にとっては、類推問題は生徒の知的能力を測る有用なツールである。なぜなら、2つの単語の意味が不明瞭な場合でも、十分に強い分析的思考力を持つ生徒であれば、それらの関係を特定できるはずだからである。[ 143 ]類推問題は2005年に削除された。[ 146 ]その代わりに、生徒が単語の関連する定義を知らない場合に、より文脈情報を提供する質問があり、正しい答えを推測しやすくなっている。[ 147 ]
2010年、オレゴン大学の物理学者スティーブン・シューとジェームズ・ションバートは、同校の5年間の学生記録を調査し、数学または物理学(生物学、英語、社会学、歴史学は除く)を専攻する学生の学業成績がSAT数学のスコアに強く依存していることを発見した。SAT数学スコアが600点未満の学生が数学または物理学専攻で優秀な成績を収める可能性は非常に低かった。しかし、SAT言語テスト、またはSAT言語と数学を組み合わせたテストと、前述の他の科目との間には、このような傾向は見られなかった。[ 148 ] [ 149 ]
2015年、デューク大学の教育心理学者ジョナサン・ワイ氏は、 1946年の陸軍一般分類試験(1万人)、1952年の選択的徴兵大学資格試験(3万8420人)、1970年代初頭のプロジェクト・タレント(40万人)、2002年から2005年の大学院入学資格試験(120万人以上)、そして2014年のSAT数学・言語(160万人)の平均テストスコアを分析した。ワイ氏は、一貫したパターンを発見した。それは、テストスコアが最も高かった学生は物理科学と工学を専攻する傾向があり、最も低かった学生は教育と農業を選択する傾向があったということである。(下図参照)[ 149 ] [ 150 ]

ローラ・H・ガン氏とその同僚は、全米1389校のデータを分析した2020年の論文で、入学者の平均SATパーセンタイル値と、STEMおよび社会科学を専攻する卒業生の割合との間に強い正の相関関係があることが明らかになった。一方、入学者の平均SATパーセンタイル値と、心理学、神学、法執行機関、レクリエーション、フィットネスを専攻する卒業生の割合との間には負の相関関係があることも明らかになった。[ 151 ]
様々な研究者が、SATやACTの平均点とUS News & World Reportの大学ランキングの間には高い相関関係があり、その相関性はほぼ0.9であることを明らかにしている。[ 17 ] [ 152 ] [ 95 ] [ b ] 1980年代から2010年代にかけて、米国の人口は増加した一方で、大学や短期大学の収容能力はそれほど大きくは拡大しなかった。その結果、入学率が大幅に低下し、両親が卒業生である学校への入学がより困難になった。さらに、今日では高得点を獲得した学生が名門校で高等教育を受けるために地元を離れる可能性が非常に高くなっている。したがって、入学率よりもSATなどの標準化されたテストの方が、選抜性を測るより信頼性の高い指標となる。それでも、マイケル・J・ペトリリとペドロ・エナモラードが、米国のトップ大学とリベラルアーツカレッジの1985年と2016年の入学した新入生のSAT総合スコア(数学と国語)を分析したところ、サンプル全体の新入生のスコアの中央値は1216から1309へと93ポイント上昇したことがわかった。特に、ノートルダム大学(1290から1440、つまり150ポイント)やエロンカレッジ(952から1192、つまり240ポイント)など、14の大学で少なくとも150ポイント上昇した。[ 153 ]
私立学校はACTやSATなどの標準テストでより良い成績を収める生徒を輩出する傾向があるという証拠があるようだが、ケビン・ダンカンとジョナサン・サンディは、全国青少年縦断調査のデータを用いて、年齢、人種、性別(7%)、家庭環境(45%)、学校の質(26%)などの生徒特性やその他の要因を考慮すると、私立学校の優位性は78%減少することを示した。研究者たちは、私立学校に通う生徒は、高得点に関連する特性をすでに備えていると結論付けた。[ 154 ]
カリフォルニア大学システムが2001年に発表した研究では、1996年秋から1999年秋までの学部生のデータを分析した結果、新入生のGPAという意味で大学での成功を予測する上で、SAT II [ c ]が最も優れた指標であることが判明しました。次いで高校のGPA、そして最後にSAT Iの順でした。家族収入と親の教育レベルを考慮に入れると、もともと低かったSATの適性と大学進学準備の測定能力は大幅に低下しましたが、高校のGPAとSAT IIの、より実質的な適性と大学進学準備の測定能力は低下せず(むしろわずかに上昇しました)、カリフォルニア大学システムは、この研究の対象となった4年間、志願者に対してSAT IとSAT IIの両方の受験を求めていました。[ 155 ]この分析は広く報道されていますが、多くの研究と矛盾しています。[ 116 ]
SATが社会的、教育的成果と相関していることを示す証拠があり、[ 123 ] 4年制大学プログラムの修了もこれに含まれます。[ 156 ]ミネソタ大学の心理学者による2012年の論文では、複数の機関のデータ セットを分析し、社会経済的ステータス (親の学歴と収入の組み合わせで測定) と高校のGPAをコントロールした後でも、SATは大学での成績を予測する能力を維持していることが示唆されました。これは、SATスコアが単に社会経済的ステータスを測定するための代理指標ではないことを意味すると研究者は結論付けました。[ 117 ] [ 157 ]この発見は再現され、人種や民族グループ、男女ともに当てはまることが示されました。[ 17 ]さらに、ミネソタの研究者は、調査した学校の学生の社会経済的ステータスの分布が、それぞれの志願者プールの分布を反映していることを発見しました。[ 117 ] SATのスコアは、その測定対象の性質上、個人の社会経済的背景と切り離すことはできません。[ 123 ]しかし、SATのスコアと親の収入や社会経済的地位との相関関係は、因果関係を意味するものではありません。高得点者の親は、認知能力が要求される仕事をしており、そのためより高い給与を得ているという可能性もあるでしょう。[ 158 ]さらに、この相関関係は実子間でのみ有意であり、養子縁組の家族間では有意ではないことから、これは経済的豊かさではなく遺伝的遺産によるものである可能性が示唆されます。[ 159 ] [ 158 ]
2007年、レベッカ・ズウィックとジェニファー・グレイフ・グリーンは、典型的な分析では、生徒の社会経済的地位だけでなく、成績評価基準においても、生徒が通う高校の多様性が考慮されていないことを指摘しました。ズウィックとグレイフ・グリーンは、これらの多様性を考慮すると、家族の社会経済的地位と学年成績および順位との相関は高まる一方で、社会経済的地位とSATスコアとの相関は低下することを示しました。彼らは、学校の成績とSATスコアは同様に家族収入と関連していると結論付けました。[ 119 ]
カレッジボードによると、2019年の受験者の56%は両親が大学卒業、27%は高校卒業以下、約9%は高校を卒業していない。(8%は質問に回答しなかった。)[ 43 ]
SATなどで測られるアジア系とヨーロッパ系アメリカ人の学生の学業成績の差について提案されている部分的な説明の1つは、アジア人は一般的に安定した両親家庭で育つ傾向があるということである。[ 160 ]エコノミスト誌は2014年に、大学院の学位を持つ親を持つ子供は、高校中退した親を持つ子供よりもSAT(2,400点満点)で平均400点高いスコアを取ったと報じた。[ 161 ]労働統計局の全国縦断調査のデータを2018年に分析した経済学者のアダム・ブランディン、クリストファー・ヘリントン、アーロン・スティールマンは、家族構造が一般的な教育成果、特にSATのスコアを決定する上で重要な役割を果たしていると結論付けた。片方の親だけが学位を持たない家族は1L、両親が学位を持たない家族は2L、両親の間に少なくとも1つの学位を持つ家族は2Hと指定された。 2H家庭の子供は1L家庭の子供に比べて大きな優位性を持っており、この差は1990年から2010年の間に拡大した。2H家庭のSAT総合スコア(言語と数学)の中央値は20ポイント上昇したのに対し、1L家庭のそれは1ポイント低下したため、両者の差は21ポイント、つまり標準偏差の5分の1に拡大した。[ 156 ]

2013年、アメリカ大学試験委員会は、テストの数学セクションで男子が女子を上回ったという報告書を発表したが、[ 162 ]この大きな格差は35年以上続いている。[ 163 ] 2015年の時点で、男子はSAT数学セクションで女子よりも平均32ポイント多く獲得している。700~800点のスコアを取った生徒のうち、男女比は1.6:1であった。[ 164 ] 2014年、心理学者のスティーブン・セシと彼の協力者は、パーセンタイル全体で男子が女子よりも良い成績を収めていることを発見した。例えば、女子が同性の中で上位10%のスコアを獲得しても、男子では上位20%にしか入らない。[ 165 ] [ 166 ] 2010年、心理学者のジョナサン・ワイと彼の同僚は、デューク大学才能発掘プログラム(TIP)の知的に優れた中学1年生160万人を対象とした30年間のデータを分析し、1980年代にはSATの数学セクションで上位0.01%のスコアを獲得した生徒の男女格差は13.5:1で男子が優勢だったが、1990年代には3.8:1にまで低下したことを示しました。[ 167 ] [ 166 ] 1980年代の劇的な男女比は、ジョンズホプキンス大学のサンプルを使用した別の研究を再現しています。[ 168 ]この比率は、1990年代前半から2000年代後半までのACTの数学と科学のスコアで観察された比率と似ています。[ 167 ]この比率は2000年代末にほとんど変化しませんでした。[ 167 ] [ 169 ] [ 170 ] SAT数学の点数における男女差は400点以上のレベルで顕著になり始めました。[ 167 ] 2000年代後半には、SAT数学テストで800点満点を取った女性1人に対して、男性は2人いました。[ 171 ] [ 169 ]
一部の研究者は、言語的および定量的推論能力において男性のばらつきが大きいことを裏付ける証拠を指摘している。 [ 172 ]体重、身長、認知能力は文化を超えて男性のばらつきが大きいことが確認されており、テストの最低分布と最高分布には男性の数が多くなっている。[ 173 ]その結果、SATなどの標準テストの数学セクションのパフォーマンス分布の上限と下限の両方に男性の数が多く見られ、観察される男女の不一致が生じている。[ 174 ] [ 166 ] [ 175 ]逆説的に、これは女子が男子よりも高い成績をとる傾向と矛盾しており[ 166 ]、女子に学力がないわけではないことを証明している。しかし、男子はカリキュラムに直接関係のない標準テストの問題ではより良い成績をとる傾向がある。[ 172 ]
一方、ワイ氏とその同僚は、SATの言語セクションに関しては上位5%の男女はほぼ互角であるものの、1980年代半ば以降、女子が男子に対してわずかながらも顕著な優位性を獲得し始めたことを発見した。[ 168 ] SATで非常に高い得点を獲得した中学1年生を対象に縦断的研究を行った心理学者デイビッド・ルビンスキー氏も同様の結果を得た。女子は一般的に言語的推論能力が優れており、男子は数学的能力が優れていた。[ 175 ]これは、95パーセンタイル以上だけでなく、一般集団の認知能力に関する他の研究結果も反映している。 [ 168 ] [ 175 ]
ステレオタイプ脅威などのテストの側面は懸念されるものの、SATの予測妥当性に関する研究では、SATは大学の女子GPAを男子GPAよりも正確に予測する傾向があることが実証されている。[ 176 ]

SATの数学の問題は、大きく分けて従来のものと非従来のものの2つのグループに分類できます。従来の問題は、使い慣れた公式やアルゴリズムを用いて日常的に解くことができますが、非従来の問題は、使い慣れた解法を通常とは異なる方法で用いたり、問題を解くために必要な具体的な洞察を導き出したりするために、より創造的な思考を必要とします。2000年、ETSの心理測定学者アン・M・ギャラガーとその同僚は、学生が自己申告で公開されたSAT数学問題にどのように対処したかを分析しました。その結果、男女ともに、授業で習った公式やアルゴリズムを用いるのが最も好まれたアプローチであることがわかりました。しかし、それがうまくいかなかった場合、男性は女性よりも適切な解法を見つける傾向がありました。以前の研究では、男性は非伝統的な解法を模索する傾向が強いのに対し、女性は授業で習った内容に固執する傾向があり、教室の教材の習得のみを必要とする場合は、女性の方が適切なアプローチを見つける傾向が高いことが示唆されていました。[ 137 ]
以前のバージョンのSATでは、学生に数学的適性と言語的推論能力にどれくらい自信があるか、具体的には自分が上位10%に入ると思うかどうかを尋ねていました。デビン・G・ポープは、1990年代後半から2000年代初頭にかけて400万人以上の受験者のデータを分析し、高得点者は自分が上位10%に入ると自信を持っている可能性が高く、最高得点者は最も高いレベルの自信を報告していることを発見しました。しかし、男女間には顕著な差がありました。男性は女性よりも自分の数学的適性にはるかに自信を持っている傾向がありました。例えば、数学セクションで700点を獲得した人のうち、男性の67%が自分が上位10%に入ると思うと回答したのに対し、女性はわずか56%でした。一方、女性は男性よりも自分の言語的推論能力にわずかに自信を持っていました。[ 177 ]
認知神経科学者のリチャード・ハイアーとカミラ・パーソン・ベンボウは、陽電子放出断層撮影(PET )スキャンを用いて、SATを受験した学生のグルコース代謝率を調べた。彼らは、男性ではSAT数学の高得点者は低得点者よりも側頭葉のグルコース代謝率が高く、脳効率仮説に反することを発見した。しかし、この傾向は女性には見られず、女性については数学的推論に関連する皮質領域は見つからなかった。彼らのサンプルでは男女の平均得点は同じで、皮質グルコース代謝率も全体的に同じだった。ハイアーとベンボウによると、これは男女間の脳の構造的違いを示す証拠である。[ 178 ] [ 20 ]
認知能力や適性を検査された6,246,729人の参加者の結果に関する2001年のメタ分析によると、黒人学生と白人学生の平均スコアの差は約1標準偏差で、SAT(受験者240万人)でも同等の結果だった。[ 179 ]同様に、平均して、ヒスパニック系およびアメリカインディアンの学生のSATの成績は、白人およびアジア系の学生よりも約1標準偏差低かった。[ 180 ] [ 181 ] [ 182 ] [ 183 ] 数学は試験の中で最も難しい部分のようである。[ 43 ] 1996年には、数学セクションにおける黒人と白人の差は0.91標準偏差だったが、2020年には0.79に低下した。[ 184 ] 2013年には、アジア系アメリカ人はグループとして、数学セクションで白人よりも0.38標準偏差高いスコアを獲得した。[ 160 ]

一部の研究者は、このスコアの差は、アメリカ社会における異なる人種グループの生徒間の全体的な学力格差と密接に関連していると考えています。この格差は、恵まれない人種グループの生徒が教育の質の低い学校に通う傾向があるという事実によって部分的に説明できるかもしれません。この見解は、人種隔離が進んだ都市や地域では黒人と白人の格差が大きいという証拠によって裏付けられています。[ 185 ]他の研究では、SATに関連する主要科目(英語と数学)におけるマイノリティの能力が低いこと、そして学業に集中しようとする生徒(「白人のように振る舞う」)に対する同調圧力が指摘されています。[ 186 ]文化的な問題は、成績優秀な親を持つ裕福な家庭の黒人生徒にも顕著に見られます。ナイジェリア系アメリカ人の人類学教授であるジョン・オグブは、黒人の若者は親をロールモデルとして見る代わりに、ラッパーのような他のモデルを選び、優秀な生徒になろうと努力していないと結論付けました。[ 187 ]
一連の研究では、試験問題の機能の違いが報告されています。これは、受験者の人種グループによって試験問題の機能が異なること、つまり、特定の試験問題の理解能力や解答に必要な知識の習得能力にグループ間で差があることを反映しているということです。2003年、フリードルは、SATで「難しい」とされる言語問題において黒人学生がわずかに有利であるのに対し、「簡単な」とされる問題では白人とアジア系の学生がわずかに有利である傾向にあることを示すデータを発表しました。フリードルは、これらの結果は、「簡単な」試験問題では、家庭環境で異なる言語を使用することが多いマイノリティよりも白人中流階級の学生にとって理解しやすい語彙が使用されていることを示唆している一方、難しい問題では講義や教科書でしか習得できない複雑な言語が使用されているため、どちらの学生グループにも同等の習得機会が与えられていると主張しました。[ 188 ] [ 189 ] [ 190 ] この研究はETS理事会から厳しく批判されたが、2010年にサンテリセスとウィルソンによるその後の研究でも結果が再現された。[ 191 ] [ 192 ]

SATの点数が少数派学生の将来の成績を体系的に過小評価するという証拠はない。しかし、SATの予測妥当性は、大学の主要な民族的・人種的構成に依存することが示されている。[ 193 ]また、一部の研究では、アフリカ系アメリカ人学生は、同じSAT点数の白人学生に比べて大学での成績が低いことが示されており、研究者たちは、白人学生は教育環境以外での社会的優位性(例えば、親の教育への積極的な関与、キャンパスでの学術活動への参加、同じ人種の教師や同級生からの肯定的な偏見など)の恩恵を受ける傾向があり、それが成績向上につながるためである可能性が高いと主張している。[ 194 ]
クリストファー・ジェンクスは、SATのような標準化された入学試験の導入によって、アフリカ系アメリカ人は集団として損害を被ってきたと結論付けている。彼によれば、これは試験自体に欠陥があるからではなく、ラベリング・バイアスと選択バイアスによるものだ。つまり、これらの試験は、アフリカ系アメリカ人が社会化の中で身につける可能性の高いスキルではなく、身につける可能性の低いスキルを測定するものだ。さらに、標準化された入学試験は、能力の特定の側面を測るテストではなく、一般的な能力を測るテストだとレッテルを貼られることが多い。こうして、教育環境や職場環境においてアフリカ系アメリカ人の能力が常に過小評価される状況が生まれ、それが彼らに対する選択バイアスを助長し、成績不振を悪化させている。[ 194 ]
アメリカ合衆国の主要な人種・民族グループの中で、SAT数学の得点格差は下位層で最も大きく、ヒスパニック系・ラテン系アメリカ人は最も低い得点範囲に留まり、アジア系アメリカ人は最も高い得点範囲に留まる可能性が高くなっています。さらに、試験に易しい問題と難しい問題の両方がさらに多く含まれれば、得点のばらつきが大きくなり、格差はさらに拡大する可能性があることを示す証拠があります。例えば、アジア系の分布を考えると、試験が許せば800点を超える得点を獲得できる可能性も高いでしょう。(下図参照)[ 195 ]

2020年はCOVID-19パンデミックによって世界中の教育が混乱した年であり、実際、米国の学生のSATなどの標準テストの成績は低下しました。しかし、格差は解消されませんでした。[ 196 ]カレッジボードによると、2020年にはアジア系の学生の83%が大学進学準備の基準である読解とライティング、80%が数学を満たしたのに対し、黒人の学生ではそれぞれ44%と21%しか満たしていませんでした。白人では、読解とライティングで79%、数学で59%が基準を満たしていました。ヒスパニックとラテン系では、それぞれ53%と30%でした。(下の図を参照)[ 184 ]


ブルッキングス研究所 の経済学者エンバー・スミスとリチャード・リーブスは、国立教育統計センターのデータを分析し、2000年から2020年の間にSATを受験する学生数は人口増加率や高校卒業者数の増加率よりも速いペースで増加したと推測した。この増加は特にヒスパニック系とラテン系の間で顕著だった。高校卒業生の数が減少していた白人の間でも、SAT受験者数は増加した。[ 184 ]例えば、2015年には170万人の学生がSATを受験し、[ 41 ] 2013年の160万人から増加した。[ 132 ]しかし、2019年には過去最高の220万人が受験し、2018年の210万人を大きく上回る記録となった。[ 43 ] SATを受験する学生数の増加は、多くの学区が学生に追加費用をかけずに学校日中にSATを実施することを申し出たことが一因です。[ 43 ]大学進学の有無にかかわらず、学生にSATの受験を義務付けている学区もあります。[ 197 ]しかし、2021年には、COVID-19パンデミックと多くの大学でSATが任意のステータスになったことを受けて、わずか150万人の学生しかテストを受けませんでした。 [ 14 ]しかし、テストセンターが再開されると、意欲的な学生は、志望校の入学方針に関わらず、競争相手から目立つためにSATまたはACTを受験することを選択しました。[ 198 ] [ 113 ] 2023年度のクラスでは、190万人の学生がテストを受けました。[ 113 ]
_aboard_the_conventionally_powered_aircraft_carrier_USS_Kitty_Hawk_(CV_63).jpg/440px-thumbnail.jpg)
心理学者のJean Twenge、W. Keith Campbell 、および Ryne A. Sherman は、米国一般社会調査( ) の語彙テストのスコアを分析し、教育を補正した後、高校以下から大学院まですべての教育レベルで、1970 年代半ばから 2010 年代半ばの間に洗練された語彙の使用が減少していることを発見しました。しかし、彼らは、SAT の言語スコアを使用して低下を追跡することに対して警告しました。大学入試委員会は SAT の言語スコアが減少していると報告しましたが、受験者の人口統計が変化し、2010 年代に SAT を受験する学生の数が 1970 年代よりも多く、つまり能力が限られている受験者の方が多かったため、これらのスコアは国全体の語彙レベルを完全には測定できないためです。[ 45 ]しかし、アメリカの高校生の読書の頻度と読解力は低下し続けているため、たとえ試験時間を短縮し、言語パートの特定の文章に関連する質問の数を減らす改革が導入されたとしても、SATを受験する生徒は良い成績を取るのに苦労するかもしれない。[ 199 ]
メンサ、インターテル、プロメテウス協会、トリプルナイン協会といった高IQ団体の中には、入会試験の一つとして特定の年度のスコアを採用しているところもあります。例えば、インターテルは1994年1月までに受験したテストで1300点以上のスコア(言語と数学の合計)を認めています。[ 200 ]トリプルナイン協会は1995年4月以前に受験したSATで1450点以上のスコア、そして1995年4月から2005年2月までに受験したSATで1520点以上のスコアを認めています。[ 201 ]メンサは1994年1月31日以前に取得したSATのスコアを認めています。
SATは一般知能と強い相関関係にあるため、特に2004年以降、研究者によって知能を測る代理指標としてよく使われてきました。[ 17 ]特に、数学的に才能のある人を研究している科学者は、研究対象を特定するためにSATの数学セクションを使ってきました。[ 19 ]
ますます多くの研究が、SATの点数が、例えば収入や職業上の業績といった面で、数十年先の個人の成功を予測できることを示しています。[ 17 ] [ 24 ] [ 11 ]教育心理学者のジョナサン・ワイ、デイビッド・ルビンスキー、カミラ・ベンボウが2005年に発表した縦断的研究によると、知的早熟な人々(上位1%)の中で、12歳のときにSATの数学セクションで高いスコアを取った人々は、STEM分野で博士号を取得するか、論文を発表するか、特許を登録するか、大学の終身在職権を確保する可能性が高いことが示唆されています。[ 202 ] [ 149 ]ワイはさらに、通学した学校のSATやACTの平均点によって測定される個人の学力は、最も裕福な人々の間でさえ、また米国の認知エリート、すなわちフォーチュン500社のCEO、億万長者、連邦判事、および国会議員のメンバーであるかどうかによって、個人の収入の違いを予測できることを示した。[ 203 ] [ 17 ]ワイは、アメリカのエリートは認知エリートでもあると結論付けた。[ 203 ]グレゴリー・パーク、ルビンスキー、およびベンボウは、SATの点数によって識別される知的に才能のある青年は、将来、芸術とSTEMの両方で創造的な偉業を成し遂げることが期待できるという統計的証拠を示した。[ 204 ] [ 17 ]
SATは、数学的早熟青少年研究(SMPY)、ジョンズ・ホプキンス大学才能ある青少年センター、デューク大学才能発掘プログラム(TIP)などの組織によって、12歳または13歳の生徒に実施されることがあります。これは、優れた能力を持つ生徒、つまり上位1%の生徒を選び、研究し、指導するためです。[ 20 ] SMPYの参加者のうち、SATの総合スコア(数学と国語)で示される上位4分の1に入る生徒は、下位4分の1に入る生徒に比べて、博士号を取得する可能性、STEM分野で少なくとも1つの出版物を持つ可能性、95パーセンタイルの収入を得る可能性、少なくとも1つの文学出版物を持つ可能性、または少なくとも1つの特許を登録する可能性が著しく高いことがわかりました。デューク大学のTIPの参加者は、SATの数学のスコアで示されるように数学が得意な場合はSTEM分野でのキャリアパスを選択し、SATの国語のスコアで示されるように国語力が優れている場合は人文科学分野でのキャリアパスを選択するのが一般的でした。比較すると、SMPYの下位四分位は平均的なアメリカ人に比べて特許取得率が5倍高い。一方、2016年時点で、SMPY参加者の博士号取得者の割合は44%、デューク大学TIPは37%であったのに対し、米国一般人口では2%であった。[ 21 ]したがって、ある一定の水準を超えると、SATなどの標準化されたテストで測定される認知能力の差は重要ではなくなるという考えは、証拠によって否定されている。[ 205 ]
2010年の論文では、SAT数学スコアの男女格差は1980年代初頭から1990年代初頭にかけて劇的に縮小したものの、その後20年ほどは続いたことが示されているが、ワイ氏らは「数学を多用する科学分野における女性の不足を説明する要素として、右端の能力における男女差はもはや無視されるべきではない」と主張した。[ 167 ] [ 206 ]
回帰不連続法を用いた独立研究によると、米国の試験校やマグネットスクールへの入学基準をわずかに上回るか下回る成績を取った生徒は、最終的に統計的に同等のSATまたはAPスコアを獲得し、その後、同様に名門大学に進学していることが明らかになっています。言い換えれば、これらの学校に通うことは、生徒の学業成績に実質的な影響を与えないということです。[ 12 ] [ 13 ] [ 207 ] : 231–37
認知能力は、職業訓練の成果や仕事のパフォーマンスと相関している。[ 116 ] [ 23 ]そのため、一部の雇用主は、将来の採用候補者の適性を評価するために SAT のスコアに頼っており、[ 24 ]特に職務経験が限られている場合はそうだ。[ 23 ]この慣行は目新しいものではない。[ 22 ]大手企業や法人は、採用ミスを避ける方法を学ぶために多額の費用を費やし、標準化されたテストのスコアは、人が仕事に適しているかどうかを判断するための貴重なツールであると判断した。場合によっては、企業は、コンピューターソフトウェアなど、独自に作成した独自の資料を扱う人を雇う必要があるかもしれない。しかし、そのような資料を扱う能力は外部の認証では評価できないため、そのような企業が一般的な知能を測定する代理的なものに頼るのは理にかなっている。[ 24 ] [ 208 ]他のケースでは、企業は学歴を気にしないかもしれませんが、将来の採用者の定量的推論能力を評価する必要があり、標準化されたテストのスコアが必要な理由があります。[ 22 ]特にゴールドマンサックスやマッキンゼーなどの投資銀行や経営コンサルティングなどの業界で最も権威があると考えられているいくつかの企業は、将来の求職者にSATのスコアを尋ねていると報告されています。[ 208 ] [ 209 ] [ 210 ] [ 211 ]
しかし、 Googleなどの大手企業の中には、採用候補者が新卒でない限り、SATやその他の標準テストのスコアを採用しないところもある。Googleのラズロ・ボック氏はニューヨーク・タイムズ紙に対し、「SATは何も予測できないことがわかった」と説明した。教育心理学者のジョナサン・ワイ氏は、SATが知能分布の右端にいる人々の知的能力を区別できないことが原因ではないかと示唆した。ワイ氏はニューヨーク・タイムズ紙に対し、「今日のSATは実際には簡単すぎるため、Googleは相関関係を見ていない。採用する人は皆、超高得点者だ」と語った。[ 24 ]
2002年、ニューヨークタイムズのコラムニスト、リチャード・ロススタインは、SATとACTにおけるアメリカの数学の平均点は、同テストの言語部分の平均点が低迷している一方で、同テストの数学部分の平均点を10年間にわたって上回り続けていると主張した。[ 212 ]
1960年代から1970年代にかけて、達成度スコアを廃止しようという動きがあった。しばらくして、達成度スコアを再導入した国や州、省は、学問水準が低下し、生徒の勉強量が減り、教育を真剣に受け止めなくなったことに同意した。これらの重要なテストはコストを上回る利益を生み出すという研究結果を受けて、一部の地域ではテスト要件が復活した。[ 213 ]しかし、2001年にアメリカ教育評議会で行ったスピーチで、カリフォルニア大学のリチャード・C・アトキンソン学長は、大学入学要件としてSAT Iなどの適性テストの廃止を主張したが、SAT IIなどの達成度テストの廃止は主張しなかった[ c ] 。 [ 214 ]アトキンソンによるSATの予測妥当性と力に対する批判は、カリフォルニア大学の学術評議会によって異議を唱えられている。[ 109 ] 2020年4月、教員で構成される学術評議会は51対0で標準テストのスコア提出義務の復活を決議したが、理事会は学術評議会の決定を覆し、結局テストの要件は復活しなかった。カリフォルニア州の人口規模を考えると、この決定は米国の高等教育全体に影響を及ぼす可能性があり、カリフォルニア州出身の学生を受け入れようとしている大学はより困難な状況に直面する可能性がある。[ 126 ]
標準化された入学試験に反対する活動家グループのフェアテストによると、2010年代には1,230以上のアメリカの大学が入学にSATとACTを求めないことを選択した。しかし、カリフォルニア大学システムとシカゴ大学のような注目すべき例外を除いて、ほとんどは小規模大学だった。[ 215 ]リストにはまた、宗教系大学、芸術・音楽学校、看護学校などニッチな学生を対象としている機関や、米国北東部の機関の大半も含まれている。[ 40 ] COVID-19パンデミックを受けて、約1,600の機関が入学にSATまたはACTの要件を免除することを決定したが、これはこれらのテストの実施と受験の両方が困難であり、多くのキャンセルが発生したためである。[ 216 ]プリンストン大学のように1年間だけ、あるいはウィリアム・アンド・メアリー大学のように3年間だけ、一時的にSATとACTを任意とすることを選択した学校もあった。また、完全に必須要件を廃止した学校もあった。[ 41 ] 2021年も標準入学試験の一時停止を延長した学校もあった。[ 126 ]しかし、これは非常に意欲的な学生が試験を受けることを止めることはできなかった。[ 41 ] [ 217 ]多くの親や十代の若者が大学入学試験の「任意」ステータスに懐疑的であり[ 217 ]自分の出願が入学審査官の目に留まりやすいようにしたかったからである。[ 42 ]このため、2020年夏に登録サイトがクラッシュしたという苦情が寄せられた。[ 216 ]一方、SATとACTのスコアを任意とした、より競争率の高い学校への出願者数は、学生がチャンスがあると思ったために劇的に増加した。[ 126 ] [ 218 ] [ 219 ]アイビーリーグの大学では出願数が2桁増加し、コロンビア大学では51%に達した一方、すでに1桁だった入学率は低下し、例えばハーバード大学では2020年の4.9%から2021年にはわずか3.4%にまで低下した。[ 220 ] [ 221 ]同時に、同じ傾向を示した下位の大学への関心も急激に低下した。[ 219]大学出願プロセスは依然として、主にエリート校志向によって左右されている。 [ 222 ] 2021年時点で900以上の大学で受け入れられている共通出願システム(Common Application)を利用した学生のうち、2020-21年度にSATまたはACTのスコアを提出したのは44%で、2019-20年度の77%から減少している。スコアを提出した学生は、高所得家庭の出身で、少なくとも片方の親が大学教育を受けており、白人またはアジア人である傾向があった。 [ 223 ]
多くの裕福な親が子供の標準テストの点数を上げるために違法に介入したことが明らかになったヴァーシティ・ブルース作戦の余波にもかかわらず、SATとACTはアメリカの親や大学進学を希望する高校生の間で依然として人気がある。 [ 224 ]彼らは「総合的な入学」のプロセスに懐疑的である。なぜなら、学校は数字では簡単に判別できない特徴にアクセスしようとするため、このプロセスはかなり不透明だと考えているからである。そのため、たとえこれを任意と宣言する学校数の増加と平行して、競争力を高めようとする受験者数が増加している。[ 41 ] [ 217 ]総合的な入学はもっともらしい選択肢のように思えるかもしれないが、出願手続きは学生や親にとってかなりストレスになる可能性があり、SATの点数やGPAが低いにもかかわらず、自分を拒否した学校に他の学生が入学したと知ると、多くが動揺する。[ 225 ] [ 222 ]総合的な入学制度があるにもかかわらず、実力主義の奨学金が考慮される場合、標準テストの点数が同点決定の基準となる可能性がある。なぜなら、標準テストの点数は競争率が高いからである。[ 217 ]奨学金と財政援助は、特に経済的に困難な時期に、学生とその保護者が高等教育の費用を大幅に削減するのに役立つ可能性がある。[ 42 ]さらに、総合的な入学制度は貴重な時間やその他のリソースを消費するため、最も選抜性の高い学校にとっては、検討に値する出願数を素早く絞り込むために、標準テストの点数を使用する以外に良い選択肢はないかもしれない。[ 126 ]
2023年に米国最高裁判所が人種に基づく入学選考を積極的差別是正措置の一形態として禁じた判決を受けて、多くの大学が民族的多様性の追求を継続する意向を示している。新たな法的現実に適応するための一つの方法は、標準化されたテストの要件を廃止することである。これにより、潜在的な原告(SFFA対ハーバード大学訴訟とSFFA対ノースカロライナ大学訴訟のアジア系アメリカ人)が差別を主張する具体的な証拠を見つけることがより困難になる。[ 226 ]
一方では、SATとACTを入学選考で任意にすることで、学校は様々な社会経済的背景を持つ、より多くの志願者を集めることが可能になります。[ 39 ]その一方で、推薦状は大学の成績を示す良い指標ではなく、[ 39 ]成績インフレは深刻な問題です。[ 39 ] [ 126 ] [ 227 ]標準テストが考慮されなくなると、学校の成績がより重要になり、成績インフレが促進されるでしょう。[ 223 ]実際、アメリカの高校の成績は親からの圧力により目に見えて上昇しており、優秀な生徒が過剰供給になっているように見え、特に低所得家庭の生徒は、実際に成績が良い生徒が目立つのに苦労しています。[ 228 ] SATを任意とした学校は、その結果、学力と準備を測る客観的な尺度を失い、[ 17 ]入学選考のための新たな方法を策定するか、独自の入学試験を開発する必要がある。[ 215 ]生徒が志望する学校の選抜性は、APクラスなどの厳しいコースの利用可能性や生徒の社会経済的地位で測られる高校の資源と相関関係にあることを考えると、SATを任意にすることは社会的不平等を悪化させる可能性がある。さらに、米国の高等教育機関に通うには費用が高いため、SATの要件を廃止すると、当該機関が成績の悪い生徒を受け入れる可能性が高くなり、そのような生徒は学業成績の悪さを理由に退学させられる可能性があり、卒業後に借金を抱えることになるかもしれない。[ 17 ] SATを任意とすることに対するもう一つの批判は、志願者の適性を測る主観的な尺度、例えば志願エッセイがより重要視されるようになるかもしれないということである。その結果、富裕層は貧困層を犠牲にして入学資格を得ることが容易になる。なぜなら、富裕層の学校カウンセラーはより優れた推薦状を書く能力があり、彼らは志願書類を有利に進めるために外部の援助者を雇う余裕があるからである。[ 223 ]
こうした懸念を受けて、マサチューセッツ工科大学(MIT)は2022年にSATの要件を復活させることを決定した。[ 229 ]米国の他の多くの大学も2024年にこれに追随した。[ 230 ] [ 231 ] [ 113 ]しかし、ノースカロライナ大学システムでは、高校のGPAが2.8未満の志願者に対してのみSATまたはACTのスコアを要求するが[ 231 ]、カリフォルニア大学システムでは引き続きテストブラインド方式を採用する。[ 113 ]
2005年、MITのライティング・ディレクター、レス・ペレルマン氏は、公開されたエッセイからエッセイの長さと新SATのエッセイスコアをプロットし、両者の間に高い相関関係があることを発見しました。50以上の採点済みエッセイを研究した結果、長いエッセイの方が一貫して高いスコアを生み出していることを発見しました。実際、彼はエッセイを読まずに長さだけを測ることで、エッセイのスコアは90%以上の確率で正しく算出できると主張しています。また、これらのエッセイのいくつかには事実誤認が多数含まれていることも発見しました。カレッジボードは事実の正確性に基づいて採点していると主張しているわけではないからです。
ペレルマン氏は、全米英語教員協会(National Council of Teachers of English)と共に、SATの25分間のライティングセクションが教室におけるライティング指導の基準を損なうとして批判した。彼らは、SATに向けて生徒を指導するライティング教師は、復習、深み、正確さに重点を置くのではなく、長々とした、定型的で冗長な文章を書く傾向があると指摘している。[ 232 ]「教師は生徒を悪いライティングをするように仕向けている」とペレルマン氏は結論づけた。[ 233 ]
2021年1月19日、カレッジボードは、2021年6月の実施以降、SATはオプションのエッセイセクションを提供しなくなると発表した。[ 7 ] [ 8 ]

SATを所有する非営利団体であるカレッジボードは、20世紀初頭に、加盟大学に統一入学試験を提供するために設立されました。加盟大学の入学者の多くは、米国北東部にある寄宿学校や私立の全日制学校からの出身者でした。試験はエッセイ形式で、手作業で採点され、受験には数日かかりました。[ 234 ] [ 235 ] 1920年代初頭までに、選抜手段としての知能テストへの関心が高まり、カレッジボードは大学入学用にそのようなテストを作成する委員会を結成しました。委員会のリーダーはプリンストン大学の心理学者カール・ブリガムで、彼は当初、この種のテストの価値を優生学の考え方を通して見出していました。[ 234 ]
1926年6月23日、当時は学力テスト(Scholastic Aptitude Test)と呼ばれていた最初のSATが8,040人の学生を対象に実施され、そのうち60%が男子で、その多くがイェール大学(26%)とスミス大学(27%)に出願していた。[ 236 ] 1934年に、ジェームズ・コナントとヘンリー・チョウンシーは、伝統的な北東部の私立学校以外のハーバード大学奨学金受給者を特定する手段としてSATを使用した。1942年までにカレッジボードはエッセイ試験の使用を中止し、SATに置き換えたが、これはハーバード大学のSATプログラムの成功と第二次世界大戦の勃発による制約によるものであった。[ 234 ]この時、SATは標準化され、ある年の学生のスコアを別の年の学生のスコアと直接比較できるようになった。 SATの2つのセクション(言語と数学)のテストスコアはそれぞれ200~800点の範囲で、1995年まで同じ学生グループがSATの標準化に使用されていました。[ 237 ]

戦後、教育試験局(ETS)の設立などいくつかの要因により、[ 238 ] SATの利用は急速に増加し、1951年までに約8万人が受験し、1971年には約150万人にまで増加した。[ 239 ]この間、SATの内容に変更が加えられたのは比較的小規模で、文章完成問題や「定量比較」の数学問題の導入、試験時間の変更などがあった。しかし、1994年にSATは大幅に変更され、学生が学校での学習と大学で必要となるスキルをより正確に反映する試験にしようと試みられた。その他の変更点としては、言語セクションから反意語問題が削除され、数学セクションに自由回答問題が追加され、電卓も使用されるようになったことが挙げられる。[ 144 ] 1995年、SATの点数低下が40年近く続いた後、平均点の低下を補うために各点数に約100点を加算する形でSATの再調整が行われました。
2005年にSATは再び変更されましたが、これはカリフォルニア大学システムから、このテストが高校のカリキュラムに十分に沿っていないという批判があったためです。[ 146 ]言語セクションから類推が、数学セクションから定量比較項目が削除されたことに加え、 [ 144 ]エッセイを含む新しいライティングセクションが追加されました。[ 240 ]この変更により、追加のセクションスコアが導入され、SATの最高スコアは2400に引き上げられました。[ 241 ]
2016年初頭、SATは一般的な高校のカリキュラムとの整合性を図るため、再び変更された。[ 242 ] [ 243 ]変更点には、エッセイを任意とすること(最高得点を1600点に戻す)、多肢選択式の質問の回答選択肢を5つから4つに変更すること、誤答に対するペナルティをなくすこと(正解のみの採点)などがあった。[ 244 ] [ 245 ] COVID-19パンデミックの状況下で学生への負担を軽減するため、2021年半ばまでにエッセイはSATから完全に削除された。[ 216 ]

SATは1926年の導入以来、何度か名称が変更されている。当初はScholastic Aptitude Testと呼ばれていた。[ 246 ] [ 144 ] 1990年、大学入試委員会がSATプログラムの変更案を検討するために設置した委員会は、「達成度と発達した能力の尺度を統合したテストは、もはや適性テストとは正確には言えない」という理由で、頭文字SATの意味をScholastic Assessment Testに変更するよう勧告した。 [ 247 ] [ 248 ] 1993年、大学入試委員会はテストの名称をSAT I: Reasoning Testに変更し、同時にSAT Achievement Testsの名称をSAT II: Subject Testsに変更した。[ 246 ] Reasoning TestとSubject TestsはまとめてScholastic Assessment Testsと呼ばれることになっていた。当時のカレッジボード会長によると、名称変更の目的は「SATは努力や指導に関わらず、生まれつき備わっていて変化しない何かを測るという一部の人々の印象を改めるため」だったという。[ 249 ]新しいSATは1994年3月に導入され、主要報道機関ではScholastic Assessment Test(学力評価テスト)と呼ばれた。[ 250 ] [ 251 ]しかし、1997年、カレッジボードはSATをScholastic Assessment Testと呼ぶのは適切ではなく、SATという文字は何の略語でもないと発表した。[ 252 ] 2004年、SAT I: Reasoning Testのローマ数字が削除され、SAT Reasoning TestがSATの名称となった。[ 246 ] 2016年の試験の再設計に伴い、名称の「Reasoning Test」の部分が削除され、現在は単にSATと呼ばれている。[ 253 ]
カレッジボードは、米国で以前に実施されたSAT試験問題を完全に再利用したとして非難されている。[ 254 ] 過去の試験問題の再利用は、試験での不正行為を可能にするために悪用され、一部の学生のテストスコアの正当性を疑わせる結果となった。アジアの試験対策会社は、新しいSAT試験の実施後数時間以内に学生に試験問題を提供していることが判明した。[ 255 ] [ 256 ]
2018年8月25日、米国で実施されたSAT試験が、2017年10月に中国で実施された国際SAT試験の不正コピーであることが判明しました。漏洩されたPDFファイルは、2018年8月25日の試験開始前からインターネット上に存在していました。[ 257 ]
彼はまた、この試験が生徒たちの高校での学習をより反映したものになることを望んでおり、そしておそらく最も重要なのは、裕福な生徒に有利に働くことが多かった、受験方法に関する過度な指導や個別指導を抑制したいと述べた。
では現在、テストの点数は高校の成績平均点(HSGPA)よりも1年次のGPAの予測因子として優れており、1年次の留年率、UGPA、卒業率の予測因子としてもほぼ同等である。³ 特定のHSGPAバンド内の学生について、標準化テストの点数が高いほど、1年次のUGPA、卒業時のUGPAが高く、4年以内(編入生の場合)または7年以内(新入生の場合)に卒業する可能性が高くなる。さらに、テストの点数によって説明される学生の成果の分散は2007年以降増加しているのに対し、高校の成績によって説明される分散は減少しているが、合計しても26%を超えることはない。 HSGPAを考慮に入れた上でも、テストの点数はあらゆる人口統計グループや分野において成功の予測因子となります。実際、過小代表マイノリティ(URM)の学生、第一世代の学生、または低所得世帯の学生にとって、テストの点数は成功のより良い予測因子となります。
…これは、私が入学事務局が出願書類を審査する様子を見ていた年に知った、ある汚い秘密だ。ほとんどの事務局は、複数のエッセイや推薦状、そして百科事典のような活動リストを求める際に、何を評価しようとしているのか正確には理解していないのだ。
…ミシガン州の訴訟に遡る20年前のアファーマティブ・アクション訴訟の原告は皆、テストの点数を一つの証拠として用いてきた。つまり、入学を拒否された生徒はSAT1500点、他の生徒は1200点だったという点を、差別を受けたという一つの証拠として用いてきたのだ。しかし、全員の点数が揃わないと、その主張をするのははるかに困難になる。