SAT
SAT测验(中国大陆俗称“美国高考”),前称学术能力测验(Scholastic Aptitude Test)和学术评估测试(Scholastic Assessment Test),是由美国大学委员会委托美国教育测验服务社定期举办的测验,做为美国各大学申请入学的重要参考条件之一。第一次考试于1926年举办。
SAT测验分为SAT推理测验(SAT Reasoning Test,旧称SAT I)和SAT学科测验(SAT Subject Test,旧称SAT II)。目前的SAT I为2005年版,耗时3小时45分钟,费用$50 (国际生源$81,不计迟到费)。总成绩分值为600 - 2400分,由三个800分部分组成(数学、批判性阅读、写作)组成。参加SAT或ACT考试是许多,但不是全部美国大学的录取要求。一些英国在内的许多其他国家的大学也开始承认这项考试。
功能
美国大学委员会声称SAT考试测验学生在大学阶段所需的文化与写作水平。他们称SAT检测考生分析与解题能力——这些能力是从高中里学来,并在大学阶段继续使用。SAT一般在高中第二、三或四年级时参加具体来说,大学委员会称将SAT分数与高中学业成绩平均点数(GPA)组合在一起,可以准确预测学生在大学阶段的学习效果。这相比单独使用高中GPA预测大一GPA来说更加准确。许多不同的研究在分析当SAT成绩被纳入计算时,高中成绩与大一成绩的相关系数十分高。
与其他国家教育系统不同,美国的不同学校的教学方法和课程都有很大的分别,不论是同一州或不同州的高中都会有所差异(见美国教育),这个差别主要源于美国的联邦制,它容许地方自主决定学校制度,而美国的税务制度下,学校的财政都是由地方政府提供的,因此一个富裕的地方政府就能够提供更多的资源给他们的学校。这个制度使各大学在不同州难以比较学生的能力,在缺乏如英国的A-level一般中央统筹的中学毕业试制度下,美国教育制度需要一个类似的评审机制,于是美国的大学就开始用SAT或ACT这类的标准测验来考核学生的基本能力,每间大学都有他们自己的考核重点,例如还有考量学校排名或是学业成绩平均点数(Grade Point Average)。
从历史角度来看,SAT在美国东西部盛行,而ACT在中西部和南部更受欢迎。一些大学要求学生上报ACT成绩,只有少数大学拒绝SAT。绝大多数大学认可SAT考试。一些高智商团体,如门萨国际、普罗米修斯社、三九高智社使用SAT成绩作为申请标准。如三九社团在1995年4月前要求SAT成绩达到1450,1995年4月到2005年2月则提升到了1520。 SAT成绩有时也被一些组织用于给13岁以下的孩子进行测试,如数学天赋儿童研究社用考试来选拔、研究、培训具有天赋的儿童。
这个考试通常都是由一些希望继续学业的中学学生或毕业生去报考的,考试的结果会提供给各学生指定的院校,即使获取入学的考量可能还包含在校成绩、老师的评语、或参与的课外活动,很多院校仍会将SAT分数视为首要粗略筛选的方法。此外,SAT的分数有时候也会成为奬学金的筛选标准。到美国读大学本科的外籍学生一般也会要求参加该考试。
考试内容
SAT Reasoning Test
在SAT推理测验(SAT Reasoning Test,旧称SAT I)中共有三个单元:写作、数学、批判性阅读(Critical Reading)。每部分计分为200-800分,所有分值都是10分进位,总分是三部分相加求和。所有主要部分都分为三小段。全部考试分十小节(Section)进行,还有一个实验题部份,此部份不计分,但测验中并未指明那一部份为实验题,故考生仍应全部作答。总测验时间为3小时45分钟,所有的环节(包括指令、发卷、填表、11分钟的休息)总计为4小时30分钟。除了数学填充题之外,所有题目答错皆倒扣,由于SAT每一类型考题都是由易而难排列,容易的问题一般会首先出现,较难的问题会稍后出现。这并不符合所有的情形(写作部分呈时间顺序),但是绝大部分,特别是数学和19道句子完成题是按照难易顺序出现。考生应先在前期的题目把握时间,才有时间应付后续较难的题组。
批判性阅读
SAT批判性阅读(前词汇部分,Verbal)由三部分组成:两个25分钟和一个20分钟部分组成,由不同的题组,包括句子填空题、长短段落阅读组成。阅读部分的开始一般是5到8个句子填空题;剩下的部分则注重于段落阅读。句子填空题考察学生的词汇、并通过要求考生选取一到两词来完成句子来考察学生对句子结构和组织的理解。阅读理解的主干部分是阅读文章段落,考生会读到从人文社科、自然科技、个人叙述抽取的文字,并就此回答相应的问题。有的部分则要求考生对比两份段落来回答问题;基本上这类段落相对较短。考题的数量与段落的长短成正比。与数学部分的难易顺序不同,阅读部分的考题随文章而变动。总之,前面的考题相对简单,后面的考题相对困难。
数学
数学包括三部分,由两个25分钟、一个20分钟组成:
· 一个25分钟部分的选择题,20道题。
· 另一个25分钟部分包括8道选择题、10道填空题。填空题需要在答题卡上填空,打错不倒扣分。
· 一个20分钟部分,全部为选择题,16道题。
· 新添章节包括代数II和散布图。这些更改使得考试难度加大。
计算器
多功能、科学、绘图计算器可以在SAT数学部分使用;然而,计算器不得在其它部分出现。QWERTY键计算器、手机计算器、便携电脑等不得在考试中使用。对SAT数学部分的改版使得计算器程序得以使用,以便节省时间、提高计算精度。这些程序使得学生可以更快地完成之前难以手动完成的计算作业。在一些地方推荐使用绘图计算器,特别是几何题,多重计算题。根据大学理事会的研究(research),数学部分的成绩与计算器的使用相关:在1/3到一半的问题上使用计算器较之不常使用计算器的分数较高。使用绘图计算器的考生也会取得相对较好的成绩。
写作
SAT的写作部分是根据,但不是照搬旧版SAT II中的写作改变而来(后者由旧版TSWE)得出,包括选择题和短文。短文分数占成绩的28%,选择题占成绩的70%。由于大学普遍抱怨学生的写作与思辨能力得不到统一监测,2005年3月SAT添加了这部分考试。
选择题包括改错、词句改进、段落改进等题型。改错与词句改进给出别扭或语法错误的句子,考察学生的语法知识。在改错部分里,学生需要找到出错词汇,指出无错句子。词句改进则需要学生选择合适的选项来纠正别扭的句子。段落改进题给出低劣的学生习作,提出一系列问题、要求考生对其进行改良,以便测试学生对组织逻辑的理解。
写作部分总会第一个出现在考卷上,为时25分钟。所有作文必须根据提示来完成。提示涉及广泛,常常富有哲理,考察不分考生的教育与社会背景。例如,考生会被问及人生劳作的重要性、技术对收益者是否有负面作用。作文结构没有固定要求,大学理事会接受“学生的阅读、研究、经验、或观察”。两位经过培训的审阅会为作文打分,分值为1-6,0分为白卷、非英语作答、非2号铅笔作答、无法识别。成绩会生成最后的总分2-12(或0分)。如果审阅的打分相差超过1分,那么第三位高级审阅会进行决断。每名审阅的平均审阅时间少于3分钟。
2004年3月,佩雷尔曼(Les Perelman)分析了大学理事会ScoreWrite一书中15分样文以及30片习作,发现超过90%的情况中,作文的成绩可以通过简单地计算字数来进行推断。两年后,佩雷尔曼训练的高中生在考试中书写了空洞内容,但包含了生僻词如"plethora"或"myriad"的作文;所有学生得到了"10"或更高成绩,在作文百分位上位列92或更高。
题型
除了作文和数学填空题之外,绝大多数SAT题型都是选择题;所有选择题都有5个选项,其中一个是正确的。每部分同种题型一般呈由易而难得的顺序排列。然而,有一个例外:长短阅读部分的题型呈时间顺序,而不是难易顺序排列。数学部分中10题中有1题不是选择题。它们需要考生在四栏框架里进行填空。
考题分值相等。每个正确答案得1原始分。每个错误答案会倒扣1/4原始分。数学填空题打错不扣分。这样使得考生猜题的期望值变为零。最终成绩由原始分值转化得来;精准的分数转化表因考方而异。
SAT只推荐有根据的推测,即当考生瞎猜时,回答正确率是20%;当考生可以排除掉一个错误答案,正确率是25%(即期望值为1/16分);排除两个错误答案为33.3%(1/6分);三个50%(3/8分)
SAT Subject Test
SAT学科测验(SAT Subject Test,旧称SAT II Test)中共有英文、历史、数学、科学、语言5部分。
英文包括: 文学
历史包括: 美国历史、世界历史
数学包括: 数学1级、数学2级
科学包括: 生态学/分子生物学、化学、物理
外语包括: 汉语含听力、法语含听力、德语含听力、日语含听力、韩语含听力、西班牙语含听力、法语、德语、现代希伯来语、意大利语、拉丁语、西班牙语
备考
SAT在美国一年开考7次,分别为:10月、11月、12月、1月、3月(或与4月轮替出现)、5月、6月。考试一般在11月、12月、5月、6月的第一个周六开考。在其它国家,SAT考试时间除了春季第一场考试(例如3月、4月)不提供,都与美国的同步。2006年,考试提供了1,465,744场次。考生在当天可以选考SAT Reasoning Test或最多三门SAT Subject Test;春季第一场考试例外,只提供SAT Reasoning Test。想要报考的申请人可以使用大学理事会的官网、通过邮寄、或致电报名,但必须提前三周。
SAT Subject Test在考试当天以一本大部头的形式呈现。因此,考生报考哪一门考试并不重要;含听力的语言考试除外;考生可以临时改变主意,选考“任意”考试,不论他们当初报考的是哪门科目。多考的考生会受到大学理事会的账单,并在付账后受到成绩单。少考的考生则不会收到退费。SAT Reasoning Test费用为$49(国际生源$78,印度、巴基斯坦采用旧版形式,为$99)。Subject test费用为$22注册基本费用(国际生源$49,印度、巴基斯坦$73)、每科$11(含听力的语言考试为每科$21)。大学理事会为低收入者提供费用减免。迟到的报名、备用试题、注册更改、电话查分、额外的成绩单会另行收费。
考生因宗教信仰的原因不能参加周六考试的可以申请第二天的考试,10月份因周日在主考8天后进行而例外。申请必须在注册时提出,并可能被拒绝。行动不便的考生,包括身体、学力方面的缘故,可以得到SAT考试方面的便利。学力不便的学生可以申请延长考试时间,如在标准时间上+ 50%;或+ 100%。
SAT培训是个暴利行业,许多公司和组织都提供考试培训,如书籍、培训班、网络课程、家教等。虽然大学理事会坚持SAT本质上无法培训,但研究显示补习班学生平均提分为数学20分、词汇10分。
成绩计量
原始分值、量尺分值、百分位数
考生会在考试结束后三周(笔试邮寄为六周)可以在线查分。分数由每部分200-800和两个写作次分数(作文和选择题)组成。除此之外,考生会收到他们成绩的百分位数(即与其它考生成绩的对比),以及原始分值,或正确答案的得分和错误答案的减分(以考试的不同从低于50分到低于60分不等)。若考生另外付费,就可以获得答案解析,后者包涵了考生的答案,正确答案以及相应的解析。
百分位数应考试的不同而不同——例如,在2003年SAT Reasoning Test两部分的800分对应百分位数的99.9,而SAT物理考试的800分对应百分位数的94。造成这种不同是因为考试的内容不同以及考生水平的不同。Subject Test常被着重复习(常与大学先修课程一并复习,后者相对更难),而且只有自知能够考好的人才会参加,导致成绩分布不宽。
毕业生的SAT成绩列在如下表中:
|
百分位数
|
2006年成绩
(1600计分)
|
2006年成绩
(2400计分)
|
|
百分位数
|
2006年成绩
(1600计分)
|
2006年成绩
(2400计分)
|
|
99.93/99.98*
|
1600
|
2400
|
|
61
|
≥1090
|
≥1600
|
|
99+ **
|
≥1540
|
≥2280
|
|
48
|
≥1010
|
≥1500
|
|
99
|
≥1480
|
≥2200
|
|
36
|
≥950
|
≥1400
|
|
98
|
≥1450
|
≥2140
|
|
24
|
≥870
|
≥1300
|
|
97
|
≥1420
|
≥2100
|
|
15
|
≥810
|
≥1200
|
|
93
|
≥1340
|
≥1990
|
|
8
|
≥730
|
≥1090
|
|
88
|
≥1280
|
≥1900
|
|
4
|
≥650
|
≥990
|
|
81
|
≥1220
|
≥1800
|
|
2
|
≥590
|
≥890
|
|
72
|
≥1150
|
≥1700
|
|
|
|
|
|
-
|
* 2400计分的满分百分位数为99.98,1600计分为99.93。
|
|
|
|
|
** 99+指超过99.5%的考生
|
|
|
|
|
旧版SAT(1995年前)封顶很高。历年,100万名考生中只有7名考过1580分。超过1580分意味着99.9995的百分位数。
SAT-ACT成绩对比
虽然,没有SAT与其竞争对手的官方分值转化表,大学理事会依然出版了非官方版表单,涵盖了1994年10月到1996年12月间103,525名考生参加两种考试的分数对照。然而,两份考试都在之后改版。一些大学有他们自己的转化表。如下是加州大学的转化表:
|
SAT (无写作)
|
SAT (有写作)
|
ACT成绩
|
|
SAT (无写作)
|
SAT (有写作)
|
ACT成绩
|
|
1600
|
2400
|
36
|
|
1080–1110
|
1620–1670
|
23
|
|
1560–1590
|
2340–2390
|
35
|
|
1040–1070
|
1560–1610
|
22
|
|
1520–1550
|
2280–2330
|
34
|
|
1000–1030
|
1500–1550
|
21
|
|
1480–1510
|
2220–2270
|
33
|
|
960–990
|
1440–1490
|
20
|
|
1440–1470
|
2160–2210
|
32
|
|
920–950
|
1380–1430
|
19
|
|
1400–1430
|
2100–2150
|
31
|
|
880–910
|
1320–1370
|
18
|
|
1360–1390
|
2040–2090
|
30
|
|
840–870
|
1260–1310
|
17
|
|
1320–1350
|
1980–2030
|
29
|
|
800–830
|
1200–1250
|
16
|
|
1280–1310
|
1920–1970
|
28
|
|
760–790
|
1140–1190
|
15
|
|
1240–1270
|
1860–1910
|
27
|
|
720–750
|
1080–1130
|
14
|
|
1200–1230
|
1800–1850
|
26
|
|
680–710
|
1020–1070
|
13
|
|
1160–1190
|
1740–1790
|
25
|
|
640–670
|
960–1010
|
12
|
|
1120–1150
|
1680–1730
|
24
|
|
600–630
|
900–950
|
11
|
历史
|
历年SAT平均分
|
|
考试
年份
|
阅读
/词汇
成绩
|
数学
成绩
|
|
1972
|
530
|
509
|
|
1973
|
523
|
506
|
|
1974
|
521
|
505
|
|
1975
|
512
|
498
|
|
1976
|
509
|
497
|
|
1977
|
507
|
496
|
|
1978
|
507
|
494
|
|
1979
|
505
|
493
|
|
1980
|
502
|
492
|
|
1981
|
502
|
492
|
|
1982
|
504
|
493
|
|
1983
|
503
|
494
|
|
1984
|
504
|
497
|
|
1985
|
509
|
500
|
|
1986
|
509
|
500
|
|
1987
|
507
|
501
|
|
1988
|
505
|
501
|
|
1989
|
504
|
502
|
|
1990
|
500
|
501
|
|
1991
|
499
|
500
|
|
1992
|
500
|
501
|
|
1993
|
500
|
503
|
|
1994
|
499
|
504
|
|
1995
|
504
|
506
|
|
1996
|
505
|
508
|
|
1997
|
505
|
511
|
|
1998
|
505
|
512
|
|
1999
|
505
|
511
|
|
2000
|
505
|
514
|
|
2001
|
506
|
514
|
|
2002
|
504
|
516
|
|
2003
|
507
|
519
|
|
2004
|
508
|
518
|
|
2005
|
508
|
520
|
|
2006
|
503
|
518
|
|
2007
|
502
|
515
|
|
2008
|
502
|
515
|
|
2009
|
501
|
515
|
|
2010
|
501
|
516
|
|
2011
|
497
|
514
|
最初的SAT在美国东北地区的院校使用。心理学家卡尔·布里格姆为陆军阿尔法贝塔测试研发了考试,用于衡量来自不同社会、经济背景的考生,消除偏差歧视。
1901版
大学理事会于1901年6月17日举办了第一场SAT考试,共973名学生参加,其中美国设有67个考点,欧洲2个。虽然考生背景千差万别,但三分之一来自纽约、新泽西、宾夕法尼亚三洲。绝大多数考生来自私立学校、学院、或是赞助学校。60%的考生申请了哥伦比亚大学。考试包括英语、法语、德语、拉丁语、希腊语、历史、数学、物理和化学。考试没有选择题,而是通过作文考察能力。最后成绩为“优秀”、“良好”、“质疑”、“欠佳”、“糟糕”五种评价。
1926版
SAT于1926年6月6月23日第一次正式举办,在当时被称为“学术能力测试”(Scholastic Aptitude Test)。考试由普林斯顿心理学家卡尔·布里格姆领导的委员会执行,考察内容包括定义、算术、分类、机械语言、类比、数列、反义词、逻辑推理、阅读理解。超过8000名学生在300多个考点参加了考试。其中,超过60%考生是男性。有超过1/4的男女考生报考了耶鲁大学和史密斯学院当时的考试节奏极其紧凑,考生需要在90分钟内回答315道题。
1928、1929版
1928年,词汇削减到7个部分,时间延长到接近两小时。1929年,章节数目再一次下降到了6个,并放松了考试时间。考试没有数学部分,只考察词汇。
1930、1936版
1930年,SAT第一次分成了词汇和数学两个部分,这种结构一直沿用到2004年。1930版词汇部分较之先前版本的考察范围要窄,只考察反义词、双重定义(类似于句子填空)、段落阅读。1936年,类比重新出现。1936年到1946年间,学生需要在80到115分钟内回答250道词汇题目(超过1/3是反义词)。1930年,数学考试出现,由100道自由回答问题组成,需在80分钟内完成,主要考察做题速度。类似1928到1929年的情形,数学部分在1936年到1941年间被取消。当1942年数学部分重新出现时,选择题被投入了使用
1946版
1946年,“段落阅读”被“阅读理解”替代,双重定义也被句子填空题替代。在1946年到1957年间,考生需要在90到100分钟内回答107到170道词汇题。从1958年开始,考试时间被固定下来,到1975年这17年间,考生都在75分钟内回答90道问题。1959年数据题被加入数学部分,并在1974年取代了数量比较。1974年,数学和词汇部分都由75分钟削减到了60分钟,考试结构的变化弥补了时间的不足。
1980版
“奋进者”(Strivers)被纳入考试计划中。该项研究由SAT的考方ETS主持,旨在探索如何让少数族裔、社会经济弱势个人得到相应的便利。初期的“奋进者”计划在1980-1994年间处于研究阶段,相应种族、性别、收入的考生若比预期多考了200分,就会获得奖励。这种观点认为有助于帮助少数族裔进入更要的大学,如常春藤大学。1992年,奋进者计划被公众知晓,导致计划在1993年终止。联邦法院听审了美国公民自由联盟、美国全国有色人种协进会、ETS的申辩后,命令研究应修正数据处理过程,并称只有年龄、种族、邮编可以被纳入“奋进者”分值计划。1994年,这些改革在SAT考试上得以实施。
1994改革
1994年,词汇部分进行了重要的调整。这些调整包括取消反义词题目,加大段落阅读分量。受到来自美国数学教师协会的压力,数学部分也进行了重要调整。自1935年来,SAT第一次给出了一些非选择题,要求学生自己填空。计算器首次被允许在考试中使用。数学部分加入了概率、初级统计学、计数、中位数与众数。
1994年,SAT I改版的平均分约为1000(词汇、数学各500)。美国顶尖大学(例如,常春藤盟校)通常要求超过1400分。
1995改革与争议
考试平均分的初衷定位为每部分500,标准差为100。当考试变得更加受欢迎,基础相对薄弱的生源也争相参加考试,导致平均成绩下滑到词汇428、数学478。1995年,SAT被“重新归位”,将“新的”平均分调整到接近500。1994年后到2001年10月的加分被记为“R”(如1260R)。老分数可以利用大学理事会的官方列表来与1995年及现今的分值进行对比,其中,词汇平均分会被提升70分、数学30分。或者说,现在的学生可以比他们的父母多拿100分(70+30)。一些教育组织认为SAT重新归位不过是对不断下滑的成绩进行遮羞。虽然考生总数提升到了500,000人次,但词汇部分成绩超过600分的人数从1972年的112,530人跌落到1993年的73,080人,跌幅为36%
2002改革
2002年10月,大学理事会允许学生选择递送SAT II的考试成绩。学生可以先看到成绩,后发送分数。大学理事会于2009年春决定再次修正成绩发送选项。一些顶尖大学,如耶鲁大学、宾夕法尼亚大学、斯坦福大学,要求申请人递送所有成绩。斯坦福大学则只禁止旧版SAT的分数选报。其它学校,如麻省理工大学和哈佛大学则全部接受成绩的选报。
2005改革
2005年,为回应来自加利福尼亚大学的批评,考试被再次修订。由于一些考题模棱两可,特别是类比题,一些试题被取消了(词汇部分的类比题、数学部分的数量比较)。由于满分数量增多,考题相应地提升了难度。新的写作部分是根据前SAT II写作考试改编而成,其中一个理由是缩小最高分与中等成绩之间的差距。其它原因是考察学生的写作能力;即作文题。新版SAT(即SAT Reasoning Test)在2005年3月12日第一次开考,“旧版”SAT则在2005年1月后不再使用。数学部分考察范围扩充到高中三年数学。词汇部分被更名为批判性阅读。
2008改革
2008年末,考试进行了新的调整。之前,申请人必须向大学递交所有的成绩,接受分数选报的大学则允许考生对报送分数自行选择。然而,虽然一些大学坚持原先的政策,分数选报在2008年起开始普及。理论上讲,考生可以选报他们的最佳成绩(或者任意成绩),一些受欢迎的大学,例如康奈尔大学,依然要求申请人汇报所有分数。大学理事会在其官网上公布了对分数选报偏好与否的大学清单,并坚持声称考生不必强迫递送自己的成绩。无论是否接受分数选报政策,绝大多数院校不会因成绩单上较低的分数对学生进行惩罚;许多大学,如哥伦比亚大学和康奈尔大学表示不看重对申请人不利的项目,关注最能反映申请人成绩和潜力的分数。大学理事会于2011年11月更新了大学对选报的偏好列表。
2012改革
自2012起,为了强化身份确认,考生被要求上传数字照片。这项举措遭致许多批评,诸如种族歧视和其它类型的歧视,一些理由是照片已经在申请过程中递交给相应的院校。
其它
更名
SAT原名为"Scholastic Aptitude Test"(译为学术能力测验)。但在1990年,出于对SAT是否能够作为智力测试的质疑,考试被更名为"Scholastic Assessment Test"(译为学术评估测试)。1993年,考试被改名为SAT I: Reasoning Test(字符不代表任何实义),并区分于SAT II: Subject Tests. 2004年,名字上的罗马字符被删除,SAT I被改为the SAT Reasoning Test。考试各大部分为:Critical Reading (批判性阅读,对应旧版SAT I中Verbal的部分的一些内容),Mathematics(数学),和Writing(写作)。The writing section包括一篇作文essay,其成绩连同grammar section(语法部分,对应旧版SAT中Verbal部分的一些内容)一道被计入写作部分。
2005年10月计分事件
2006年3月,有消息称一小部分SAT考生在2005年10月份的考试中得到了错误的成绩,这是由于答卷被弄湿了,没有被正确扫描。大学理事会称他们会为低分考生补加分数,但在当时,考生已经使用考分申请大学了。大学理事会决定不会为高分考生更改分数。2005年,约4,400名低分考生向法院递交了诉讼。2007年8月,法院判决责令大学理事会及相关公司向超过4,000名考生赔偿285万美元。每名考生可以得到275美元,或申请更多赔偿。类似的事件在2010-2011年中学入学考试上出现过。ERB(教育记录局,Educational Records Bureau)称录取过程出现事故,2010年参加独立学校入学考试(Independent School Entrance Examination)考试以申请私立学校的考生有17%的成绩出现错误。ERB主席大卫·柯隆(David Clune)在《纽约时报》上称在学生申请学校上出错是“我们在某时都要上的一堂课—生活并不公平。”
与IQ的关系
弗雷与迪特曼(Frey and Detterman, 2003)分析了SAT成绩与智力测试分数之间的关系。他们发现SAT分数与一般智力因素,或g值相关程度很高。(样本r=.82,非线性修正后为.86)。SAT分数与瑞文氏标准推理测验分值的相关系数为.483(限制范围修正后为.72)。他们断定SAT主要是g值的考察测试。本靳与他的同事(Beaujean and colleagues, 2006)也得到了类似的结论。
文数差距
2002年,理查德·罗斯坦(Richard Rothstein,教育学者、专栏作家)在《纽约时报》上称SAT与ACT的数学在平均分上依然高于词汇成绩,继续了上个年代的增长趋势。
文化偏差
几个年代以来,许多批评家们都指责SAT词汇的设计偏向白人与富人。著名的例子是SAT I中的oarsman–regatta类比题。该题旨在找到与"runner"和"marathon"(跑步运动员-- 马拉松)最为类似的选项。正确答案是"oarsman"和"regatta"(划手 -- 赛船)。正确答案假设学生对赛艇运动十分熟悉,这一运动在富人社会十分流行,也是对应其知识结构与措辞的。53%的白人考生回答正确,而只有22%的黑人考生给出了正确答案。然而,根据穆瑞与赫恩斯坦(Murray and Herrnstein),黑白差距在这道文化题上比一些文化中性的题还要小。类比题后被短篇阅读所取代。
废弃SAT
越来越多的大学响应了SAT选考运动。这些大学在录取上不要求SAT成绩。在2001年美国教育大会上,加利福尼亚大学校长理查德·阿特金森敦促院校在大学录取上废弃SAT Reasoning Test的指标:
"任何参与教育事业的人都知道对SAT的过分强调对教育的优先性与实践性产生了多么大的扭曲,知道考试是多么的不公平,知道考试是如何摧毁年轻学生的自信与热情。SAT伤害美国教育这一事实已经获得了广泛的共识。"
为回应加州大学的威胁,大学理事会宣布在2005年3月对SAT进行改革,细节如下:
在二十世纪60到70年代,曾出现过废除成绩测试的运动。一段时间后,国家、州县、省份重行实施考试,承认学术标准下降了,学生不学习了,不把学习当回事儿了。他们重启了考试,并经研究发现高标准的考试所带来的好处大于代价。
MIT研究
2005年,MIT写作主任莱斯·佩雷尔曼(Les Perelman)将新版SAT的范文长度与分数进行对比,发现很高的相关程度。在研究了超过50多篇作文后,他发现长作文得高分。事实上,他辩称仅通过观察作文长短而非阅读内容,就可以在90%的情况下给定作文分数。他发现一些作文存在事实谬误;但大学理事会对此没有响应。
佩雷尔曼与美国英文教师协会(the National Council of Teachers of English)也批评25分钟的写作部分伤害了课堂写作教育的标准。他们称SAT培训教师不会关注修改、深度、精准,而他们会着重于写足够长的、公式化的、啰嗦的章节。 "你使得老师将学生教成烂作家",佩雷尔曼如此总结道。
贫富分差
最近的研究指出来自高收入家庭的考生呈较高平均分。来自加州的成绩数据显示家庭收入低于每年$20,000的考生平均成绩为1310,而收入高于$200,000的平均成绩为1715,相差405分。SAT分数与家庭收入之间的相关度为0.23到0.4(解释5-16%的变量)。一些计算显示每增加$20,000收入,就增加40点平均分。这个相关富有争议。有人认为这是富家子弟获得优质教育与补习的结果。另一些则认为富有家庭可以获得更广的文化熏陶与经验,是旅游以及其它习得方式的结果,而“文化教育”可以提高成绩。
世界范围影响
从全球看,SAT的影响及有关SAT的了解并不广泛,因为其他国家通常都拥有自己的标准化考试。然而,对于感兴趣的学生,SAT在全球都能参加。
位于美国外的、想获准进入美国的学院/大学的毕业生通常被要求提供SAT(或ACT)成绩。这些学生通常不会被事先通知能否参加这些考试,并且多数在美国以外的教师(特别是那些非英语国家的教师)也并不了解这一要求。通常,有意的学生必须自己(通常是从美国大使馆,领事馆,国际学校并且/或获取免费的“SAT项目注册公告国际版”)获取关于该测试的信息。SAT在美国外许多国家和地区亦设有考点,但仍有些地区无考点,如中国大陆,中国大陆考生一般会选择去香港或新加坡参加考试。