外语界 2001 年第 1 期 ( 总第 81 期)
大学英语四 、 六级考试分数解释
□ 杨惠中     金 艳
提要 : 本文作者从考试的效度和信度出发 ,论证了设计一项有效考试必须首先定义所要测量的语言能力结 构 。由于考试结果通常用分数来表达 ,因此作为科学的考试其分数必须具有可解释性 ,分数解释又涉及记分 体制 。为了使分数带有大量信息 ,便于用户使用 ,大规模标准化考试在最终报道考试成绩前 ,分数要经过加权 处理 、 等值处理 、 正态化转换等一系列转换过程 。作者接着说明了大学英语四 、 六级考试的分数解释和分数使 用。 关键词 : 分数可解释性 ; 记分体制 ; 大学英语四 、 六级考试 ; 尺度相关 - 常模参照考试
Abstract : This paper starts from defining the construct to be measured in the CET tests , predicted by the necessity of ensuring
pretable , which involves the use of a certain scoring system. In large2scale standardized tests , the test scores , before release , have to undergo a series of transformation processes , including score weighting , score equating , and score normalization , etc. , the CET test scores are interpreted and used. the reliability and validity of a test. Since the test results are usually reported in the form of test scores , they must be inter 2 in order to provide as much feedback information as possible to the end users of the test. The authors then explain in detail how
中图分类号 : H3
  10. 42   文献标识码 : C   文章编号 : 1004 - 5112 (20
  01) 01 - 0062 - 07

  1. 效度 、 信度与考试成绩报道

  1. 1 定义所测量的语言能力结构
行客观的 、 准确的 、 公正的评价 。由于语言能 项简单的任务 。
力是一种心理量 , 要做到这一点显然不是一
要测量语言能力首先要定义所测量的语 言能力结构 ( the construct to be measured) , 这 涉及一项语言测试的效度 。效度回答的是 题 ,不同的语言观和语言能力学说决定了语 言测试的内容不同 , 测试方法也不同 。可以
“一项语言测试考的是什么语言能力 ?” 的问
说语言测试是一定的语言观的具体实施与操 作 (operationalization) 。 语言测试的历史并不长 , 但已经经历了
前科学时期 、 心理测量 ? 结构主义时期 、 总体 综合法时期和心理语言学 ? 社会语言学时 ・62 ・
Key words : score interpretability ; scoring systems ; the CET tests ; criterion2related norm2referenced tests
期 ,这一发展历程是和语言学的发展同步的 。 在当前国际语言测试界 , 得到广泛接受的是
语言测试的任务是对考生的语言能力进
Bachman 教授等所提出的交 际 语 言 能 力 学
说 。他认为语言交际能力 “包括两个部分 : 语 ( language competence) , 或称语言知识 , 言能力
和 元 认 知 策 略 ( meta2cognitive strategies ) ” (Bachman 1996∶ ) 。他说 “语言知识可以看 67 : 作记忆中的一个信息域 , 在语言使用中产出 或解释话语时供元认知策略调用 。语言知识 包 括 两 大 类 : 结 构 组 织 知 识 ( organizational
knowledge) 和语用知识 。 ” “语用知识使我们能
够把说出的话 、 句子 、 篇章与意义关连起来 ,
与用户的交际意图关连起来 , 与相关的语言
情景关连起来 , 从而产出或理解话语 。语用
知识有两个方面 : 语言功能知识和社会语言 知识 。( 同上 , 1996∶ ) Bachman 指出 “语言 ” 69 : 使用者在产出和理解话语时把所有这些方面
Foreign L anguage World No. 1 2001 ( General Serial No.
  81)
的能力综合起来 ,使话语适合一定的情景 ,正 是这种能力使语言的使用成为可能 。 ( 同上 ” 1996∶ ) 70
Bachman 等的交际语言能力学说提出于 90 年代初 ,到 90 年代中成熟 。
也涉及语言测试的效度 。语言能力本身无法 直接观察 ,能够观察到的只是使用语言的行 为 ,语言行为是语言能力的表现 ,因此语言测 试是通过对语言行为的测量来推论受试的语 言能力 。另一方面 , 语言测试只可能在有限 的时间内进行 , 不可能测试到受试的全部语 言行为 ,从统计学的角度来说也没有这个必 要 ,而只需要对受试的全部可能的语言行为 进行有效抽样 。有效样本必须满足三个条 件 ,即样本要有代表性 、 样本要有足够大的 量、 抽样要有随机性 。满足了这些条件 ,有效 样本可以反映总体的统计特征 。这是语言测 试的实质 ,对此李筱菊教授有非常精辟的论 述 ( 李筱菊 1997∶ -
  43) 。图 1 中 A 表示需 39 要测量的交际语言能力 ,但是无法直接观察 ;
B 是凭这种能力所能做到全部语言行为 。如
我国的大学英语四 、 六级考试于 1987 年 起步 。其目的是推动 《大学英语教学大纲》 的 贯彻执行 ,并考核修完大学英语四 、 六级课程 的学生的英语语言水平 。 目前的大学英语四 、 六级考试语言能力 结构模型中 ,分立语言测试 、 综合语言测试以 及交际语言测试各占有一定的比例 , 反映出 大学英语四 、 六级考试设计者对语言测试各 家学派优点的吸收 , 也能窥见语言能力观变 迁所留下的痕迹 。 “由于语言能力 ( 即对语 言知识的掌握 ) 是交际能力的基础 , 因此不 掌握语言能力就谈不上发展语言交际能力 。 在语言测试方面 , 分析法可以更好地测试对 语言知识的掌握程度 , 而综合法便于更好地 测量语言运用能力 ,因此两者不应互相排斥 , 而应当互相补充 。( 杨惠中 ,Weir 1998∶ ) 在 ” 60 大学英语四 、 六级考试中一直包括有词汇语 法知识部分 、 综合填充部分和文章改错部分 , 就是这一观点的具体表现 。前者考查语言能 力 ,使用分析法测试 ; 后两者测量语言综合运 用能力 ,使用的是综合法测试 。在听力和阅 读理解部分更是将二者融为一体 。听力和阅 读虽然只是单向的语言信息吸收 , 但也是一 种语言交际活动 ,何况没有正确的输入 ,输出 又从何谈起呢 ? ( 大学英语四 、 六级考试的 “作文”书面表 ( 达) 和 “英语口语考试” CET2SET) , 则是一种 交互式的 “交际语言能力” 测试 , 前者测量的 是书面交际能力 ( 看材料 ,写文章) ,后者则完 全在一个真实的英语交际情景中发生 , 测量 的是口头交际能力 。
  1. 2 语言测试是采样过程 在定义了所测量的语言能力以后 , 还有 如何测量的问题 ,这涉及到语言测试的信度 ,
果 a 是对交际语言能力 A 的有效抽样 , 又如 果 b 是对全部可能的语言行为 B 的有效抽 样 ,那么语言测试就是通过 b 来最终推论出 受试的交际语言能力 A 。
考试结果通常用成绩来进行报道 ( 图 1 中的 F) 。如果分数是对被测量的语言行为 抽样的正确表示 , 则可以通过分数来推论出 受试的语言能力 。
  2. 分数的可解释性 考试的最终结果是以分数的形式报道考 生成绩 ,这就涉及分数的可解释性问题 。如 果分数任意性很大而且又不可解释 , 那么这 样的考试就没有什么意义 。 对于科学的考试来说 , 考试的分数必须 满足以下条件 :
  1) 反映考试的效度 ;
  2) 反映考 ・63 ・
外语界 2001 年第 1 期 ( 总第 81 期)
试的信度 ;
  3) 反映测量的精度 ;
  4) 分数具有可 解释性 ;
  5) 体现测量的公正性 。 成绩报道要力求做到信息量大 、 标准可 靠、 清晰明白 ,还要公平公正 。大规模考试往 往有广泛的社会影响 , 一项考试在社会上的 权重越大 ,则考试结果所产生的社会后果也 越大 , 考试也就成为高风险考试 ( high2stake tests) 。确保考试的信度和效度 , 确保测量的 精度和测量的公正性 , 使考试的分数不但可 以解释而且可以准确地推论出受试的语言能 力 ,这是语言测试工作者的社会责任 。 为此 ,大规模标准化考试一般不采用原 始分 ( 即答对题数 ) 来报道考生成绩 , 因为这 样做分数的信息量太小 , 通常要进行一系列 的分数转换过程 , 使最后报道的分数不但信 ・64 ・
   其中数据输入后的数据处理包括三个部 分:
  1) 客观题部分首先要作加权处理 ,加权 反映了语言测试设计者对语言能力不同部分 的不同要求 ,反映了对不同教学目标的侧重 。 大学英语四 、 六级考试中阅读能力 、 听力 、 词 汇语法等各个部分每答对一题的得分都是不 同的 。在经过加权处理后 , 还要对客观题部 分用 IRT ( 试题响应理论 ) 模型作等值处理 , 以滤除不同考次间题目难易变化对得分的影 响 。尽管大学英语四 、 六级考试的全部题目 在实际使用前都要经过 “命题 ? 审题 ? 试题 项目分析 ? 复审 ? 构卷” 的漫长过程 ,在实考 前整个试卷的难易度均已得到控制 , 但预测 是在考生中抽样进行的 , 与实考结果难免会 有所差异 ,这些差异须要通过 IRT 等值处理 加以滤除 ,不能因题目难易而影响考生得分 , 这样做也保证了不同考次之间分数的可比 性;
  2) 主观题部分 ,如作文 ,要通过调整以滤 除阅卷员主观因素的影响 。为了保证阅卷员 的阅卷信度 ( 包括阅卷员本人的评分一致性 、 阅卷员之间的评分一致性 、 阅卷点之间的评 分一致性) , 大学英语四 、 六级考试采取了一 系列措施 ,包括制定明确的评分标准 、 确定评 ( range2finders) 、 分参照卷 严格的阅前培训 、 阅 卷过程随机抽查等等 。在采取以上这些有效 措施后依然存在的误差可以称为系统误差 , 大学英语四 、 六级考试开发了一套软件系统 , 根据考生在主 、 客观题上得分的相关性进行 调整 ,以滤除系统误差 。实践证明大学英语 四、 六级考试作文部分的阅卷信度相当高 ;
  3) 分数的正态化处理 。大学英语四 、 六 级考试是一种尺度相关 ? 常模参照考试 。它 以一定的常模为参照 ,大学英语四 、 六级考试 的记分体制采用正态分制 。
  3. 记分体制 大规模标准化考试通常采用以下记分体 制:
息量大而且具有可解释性 。 大学英语四 、 六级考试每次考试结束后 到发布考试成绩之前 , 要经过一系列的统计 处理 ,分为数据输入 、 数据处理 、 成绩计算及 统计分析三部分 ,其流程如图 2 所示 。
Foreign L anguage World No. 1 2001 ( General Serial No.
  81)
   ) 正态分制 ( normal score scale) 1 考生成绩有好有差 , 这是客观存在 。一 项科学的考试应当能够把考生成绩的差异表 现出来 ,按成绩好坏进行客观而准确的排序 。 对于大规模考试来说 , 考生的能力一般呈正 态分布 ,这可以用均值和标准差来进行描述 。 正态分就是用考生在考生总体中的相对位置 来表示考生成绩 , 也就是用均值和标准差来 表示考生成绩 。因此这是一种间接可解释的
记分体制 ,但分数的信息量大 ,且分数具有可 比性 。以 TOEFL 记分体制为例 ,其报道分以 500 分为均值 , 以 70 分为标准差 ( 如图 3 所 示) 。如果某考生得 500 分 ,则在全世界每年 约 84 万考生中优于 50 %的考生 ; 得 570 分 , 优于
  84. 1 %的考生 ; 从另一方面讲 , 如果把 攻读学位的英语要求定位于 TOEFL 550 分 , 则意味着只选拔全体考生中英语成绩最好的 20 %左右的考生 。可见正态分制不但信息量 大 ,而且十分便于用户使用 。此外 ,由于对大 规模的教育现象来说不可能出现考生成绩突 变 ,因此通过等值处理不但可以使不同考次 的分数具有可比性 , 而且可以使分数的解释 具有稳定性 , 逐步地就使分数除了选拔性外 也获得了间接的可解释性 。 正态分制主要用于常模参照测试 ( norm2 referenced tests) 。 ・65 ・
图3
Band 9  Expert User.  Has fully operational command of the language : appropriate , accurate and fluent with complete un 2 derstanding. tion well. ing. likely to make many mistakes. Should be able to handle basic communication in own field. Band 4  Limited User. Basic competence is limited to familiar situations. Has frequent problems in understanding and ex 2 pression. Is not able to use complex language. breakdowns in communication occur. written English. Band 1  Non User. Essentially has no ability to use the language beyond possibly a few isolated words. Band 0  Did not attempt the test . No assessable information. misunderstandings in some situations. Generally handles complex language well and understands detailed reason 2 misunderstandings. Can use and understand fairly complex language , particularly in familiar situations. and inappropriacies. Misunderstandings may occur in unfamiliar situations. Handles complex detailed argumenta 2
Band 8  Very Good User. Has fully operational command of the language with only occasional unsystematic inaccuracies
Band 7  Good User. Has operational command of the language , though with occasional inaccuracies , inappropriacies and
B
 

相关内容

大学英语四六级考试分数解释

   外语界 2001 年第 1 期 ( 总第 81 期) 大学英语四 、 六级考试分数解释 □ 杨惠中     金 艳 提要 : 本文作者从考试的效度和信度出发 ,论证了设计一项有效考试必须首先定义所要测量的语言能力结 构 。由于考试结果通常用分数来表达 ,因此作为科学的考试其分数必须具有可解释性 ,分数解释又涉及记分 体制 。为了使分数带有大量信息 ,便于用户使用 ,大规模标准化考试在最终报道考试成绩前 ,分数要经过加权 处理 、 等值处理 、 正态化转换等一系列转换过程 。作者接着说明了大学 ...

大学英语四六级考试的写作方法指导

   大学英语四六级考试的写作方法指导 一、语言第一位 四、六级写作重点考查考生的英语(论坛)表达能力。阅卷老师最重视的是语言,考生最需要提高的 也是语言。有的同学以为使用一些高难词汇就能取得高分,其实不然。中英文写作都讲究“平淡如水”、“简 洁就是美”、“绚烂之极,归于平淡”。美国作家海明威经常使用小学词汇,但他是诺贝尔文学奖的得主,可 见语言的好坏不在词藻的华丽与否,而在于使用得是否得当。中学词汇用好了,完全可以取得各种英语写 作考试的满分。当然基础较好的同学,恰当使用高难词汇有助于提高分数。 ...

09年英语四六级考试时间、流程、题型、分数分配及查分

   年英语四六级考试时间,流程,题型, 引用 09 年英语四六级考试时间,流程,题型,分数分配及查分 默认分类 2009-12-04 10:36:42 阅读 53 评论 0 字号:大中小 引用 Fredda 的 09 年英语四六级考试时间,流程,题型,分数分配及查分 以下是四六级考试时间及流程, 以下是四六级考试时间及流程,请即将参加考试的考生务必铭记于 心.平时训练时请按流程调整好自己的做题时间.考试将至,预祝大家 平时训练时请按流程调整好自己的做题时间.考试将至, 取得自己满意的成绩.祝君好 ...

大学英语四六级

   关于大学英语四六级 ??学习部:陈宇 陈田 未来职业规划向导 第三期 一,考试介绍 二,考试条件 三,报名时间 四,报名方式 五,考试时间 六,准备考试 考试介绍 大学英语考试是教育部主管的一项全国性的英 语考试, 语考试,其目的是对大学生的实际英语能力进 行客观,准确的测量,为大学英语教学提供测 行客观,准确的测量, 评服务. 评服务.大学英语考试是一项大规模标准化考 试,在设计上必须满足教育测量理论对大规模 标准化考试的质量要求,是一个"标准关联的 标准化考试的质量要求,是 ...

大学英语四级考试

   Breakfast or Internet Karl and Dorsey Gude of East Lansing, Michigan, USA, can remember simpler mornings, not too long ago. They sat together and chatted as they ate breakfast at home. They read the newspapers and competed only with the television ...

大学英语四级考试

   大学英语四级考试( 大学英语四级考试(CET  4) ) (恩波英语研究所命题) 恩波英语研究所命题) COLLEGE ENGLISH TEST ?Band Four? 试题册 (125 分钟) 恩波英语模考试卷Part Ⅰ Writing(30 minutes) 注意: 注意:此部分试题在答题卡 1 上。 Part Ⅱ Reading Comprehension(Skimming and Scanning)(15 minutes) Directions: In this part, yo ...

大学英语四级考试流程

   大学英语四级考试流程 8:509:00试音时间 9:009:10播放考场指令, 发放作文考卷 9:10取下耳机,开始作文考试 9:35发放含有快速阅读的试题 册(但9:40才允许开始做) 9:409:55做快速阅读 9:5510:00收答题卡一(即 作文和快速阅读) 9 5510 00 9:5510:00重新戴上耳机, 试音寻台,准备听力考试 10:00开始听力考试,电台开始 放音 听力结束后完成剩余考项。 11:20全部考试结束。 ...

英语四六级-菜鸟学英语

   Baobab 的学英语经历 菜鸟学英语 前言 这是一本菜鸟写的书,亦是写给菜鸟们看的书. 这两年,我一直都在旺旺英语论坛答疑,写些英语学习的心得体会,平常也时常指 点他人如何自学,偶尔还被请到某某外语学校做报告,不过一直都没敢想过有天会写英 语学习的书:首先,我的英语不怎么样;其次,我没有名气,也没有取得什么成就.这 样的菜鸟,有什么资格写书?又会有什么人读呢? 直到有天,读到了一位大学英语老师写的英语学习的书.这位老师英文非常好,遗 憾的是,在他书中只给出宏观的一些指导,并未给出具体的方法 ...

英语四六级考试备考经验

   英语四六级考试备考经验 备考英语四六级首先要明确四个重点:听力,阅读,词汇和真题。听力和阅读是就题型 重要性来说的。在所有题型中,他们是分值最高的。因此,在有限的时间内,应该重点突破 这两部分。 当然, 有的学生可能听力是强项, 作文失分多, 那么自然应该多下力气在弱项上, 因人而异。掌握好听力和阅读的前提是词汇量的积累。词汇的记忆虽然并不复杂,但是由于 单词多而散,需要重复和持久性记忆,常常成为最让学生头疼的事。因此,有必要在这方面 花功夫。对于四六级考试来说,最宝贝的工具就是历年真题。虽 ...

2011年大学英语四级考试口试大纲及样题.

   2011 年大学英语四级考试口试大纲 编辑提醒 2011 年上半年大学英语四级考试将在 6 月 18 日 09:00~11:20 举行,下半年将在 12 月 17 日 09:00~11:20 举行,为了帮助大家有效的报考复习,考试大外语站点编辑收集整理了 相关信息供大家参考,希望对大家有所帮助,考试大祝大家顺利通过考试! 考试介绍 考试中心 考试时间 计分规则 报名条件 考试培训 考试大纲 成绩查询 机考解析 证书样张 口试大纲 口语考试成绩合格者由教育部高等教育司发给证书,证书分为 A、 ...

热门内容

2010年高考英语试题分析(英语书面表达与短文改错)PDF

   2010 年高考英语试题分类汇编??书面表达 (2010 高考全国Ⅰ) 假设你是育才中学学生会主席李华,你校将举办一次英语演讲比赛(speech contest),希望附近某大学的外籍教师 Smith 女士来做评委,请参照以下比赛通知给她写一份信, 英语演讲比赛 主题:人与自然 时间:6 月 15 日下午 2:00?5:00 地点:501 教室 参赛选手:10 名学生 注意:词数 100 左右. 联系人:李华(电话 4487665) b)可以适当增加细节,以使行文连贯; c) 开关语已为你写 ...

当面临「英语面试」时,你也可以微笑ALL PASS

   当面临「英语面试」 当面临「英语面试」时,你也可以微笑 ALL PASS! ! 刘平(空勤学园总监) VS. 邱文仁(104 职场谘询师) 对求职者来说面试已经是一件不容易的事情!如果需要面临「英语面试」,难度 更是加倍!事实上,即使许多求职者原本英文能力还不错,但是只要碰到到英语 面试,由於紧张及非母语的关系,表现也不免大打折扣.事实上,如果你具备基 本的英文能力,可以根据充分的准备,在「英语面试」脱颖而出.以下是我们的 建议. 邱文仁: 社会新鲜人即将进入职场,除了一般求职面试的问题之外 ...

初二英语作文专题(一):大作文

   英语作文专题(一) 名校通 初二年英语作文基础课 执教老师: 执教老师 樊老师 2011年3月15日 年 月 日 1 英语作文专题(一) 执教老师: 执教老师 樊老师 二、英文书信 三、英文请假条、便条 四、英文讲稿(发言稿、自我介绍) 五、 英文通知 六、英文日记 英语作文专题(一) 执教老师: 执教老师 樊老师 看图写话: 看图写话: 给出画面,或英文提示, 给出画面,或英文提示,按要求 写作。 写作。 看图(或材料) 看图(或材料)填空 材料作文( 材料作文(近年各地市常 考的题型): ...

英语学习一定要养成的20个习惯

   1. 学习英语是随时随地的:一个习惯,就是每次买了一件新东西我都会对上面的包装或说明书仔细研究一番,当然我不是在研究商品本身,我是为了看上面的英语注释,想多几个地道的英语表达而已。前几天我买了一瓶止咳露,又从上面学到不少东西呢。比如说,有效期可以说成validity,规格可以说成specification,贮藏可以说成storage,放在儿童接触的地方可以这样说keep out of the reach of children,等等等等。这些东西都非常实用,虽然有时你看了一遍不一定记得,但当你 ...

英语模拟试卷1( 初中会考模拟1)

   二年福州市初中毕业会考、 二 00 二年福州市初中毕业会考、高级中等学校招生考试 英语试卷 1-1 (满分 150 分;考试时间:120 分钟) (注意:考生必须将答案填写在答题卷上) 听力部分(30 分) Ⅰ.Listen to the tape and choose the right word or phrase you hear in the sentence. (听录音,选择你在句子中所听到的单词或词组,每小题念一遍。(5 分) ) 1. A.make B.wake C.take ...