外语界 2001 年第 1 期 ( 总第 81 期)
大学英语四 、 六级考试分数解释
□ 杨惠中   金 艳
提要 : 本文作者从考试的效度和信度出发 ,论证了设计一项有效考试必须首先定义所要测量的语言能力结 构 。由于考试结果通常用分数来表达 ,因此作为科学的考试其分数必须具有可解释性 ,分数解释又涉及记分 体制 。为了使分数带有大量信息 ,便于用户使用 ,大规模标准化考试在最终报道考试成绩前 ,分数要经过加权 处理 、 等值处理 、 正态化转换等一系列转换过程 。作者接着说明了大学英语四 、 六级考试的分数解释和分数使 用。 关键词 : 分数可解释性 ; 记分体制 ; 大学英语四 、 六级考试 ; 尺度相关 - 常模参照考试
Abstract : This paper starts from defining the construct to be measured in the CET tests , predicted by the necessity of ensuring
pretable , which involves the use of a certain scoring system. In large2scale standardized tests , the test scores , before release , have to undergo a series of transformation processes , including score weighting , score equating , and score normalization , etc. , the CET test scores are interpreted and used. the reliability and validity of a test. Since the test results are usually reported in the form of test scores , they must be inter 2 in order to provide as much feedback information as possible to the end users of the test. The authors then explain in detail how
中图分类号 : H3
 10. 42  文献标识码 : C  文章编号 : 1004 - 5112 (20
 01) 01 - 0062 - 07

 1. 效度 、 信度与考试成绩报道

 1. 1 定义所测量的语言能力结构
行客观的 、 准确的 、 公正的评价 。由于语言能 项简单的任务 。
力是一种心理量 , 要做到这一点显然不是一
要测量语言能力首先要定义所测量的语 言能力结构 ( the construct to be measured) , 这 涉及一项语言测试的效度 。效度回答的是 题 ,不同的语言观和语言能力学说决定了语 言测试的内容不同 , 测试方法也不同 。可以
“一项语言测试考的是什么语言能力 ?” 的问
说语言测试是一定的语言观的具体实施与操 作 (operationalization) 。 语言测试的历史并不长 , 但已经经历了
前科学时期 、 心理测量 ? 结构主义时期 、 总体 综合法时期和心理语言学 ? 社会语言学时 ・62 ・
Key words : score interpretability ; scoring systems ; the CET tests ; criterion2related norm2referenced tests
期 ,这一发展历程是和语言学的发展同步的 。 在当前国际语言测试界 , 得到广泛接受的是
语言测试的任务是对考生的语言能力进
Bachman 教授等所提出的交 际 语 言 能 力 学
说 。他认为语言交际能力 “包括两个部分 : 语 ( language competence) , 或称语言知识 , 言能力
和 元 认 知 策 略 ( meta2cognitive strategies ) ” (Bachman 1996∶ ) 。他说 “语言知识可以看 67 : 作记忆中的一个信息域 , 在语言使用中产出 或解释话语时供元认知策略调用 。语言知识 包 括 两 大 类 : 结 构 组 织 知 识 ( organizational
knowledge) 和语用知识 。 ” “语用知识使我们能
够把说出的话 、 句子 、 篇章与意义关连起来 ,
与用户的交际意图关连起来 , 与相关的语言
情景关连起来 , 从而产出或理解话语 。语用
知识有两个方面 : 语言功能知识和社会语言 知识 。( 同上 , 1996∶ ) Bachman 指出 “语言 ” 69 : 使用者在产出和理解话语时把所有这些方面
Foreign L anguage World No. 1 2001 ( General Serial No.
 81)
的能力综合起来 ,使话语适合一定的情景 ,正 是这种能力使语言的使用成为可能 。 ( 同上 ” 1996∶ ) 70
Bachman 等的交际语言能力学说提出于 90 年代初 ,到 90 年代中成熟 。
也涉及语言测试的效度 。语言能力本身无法 直接观察 ,能够观察到的只是使用语言的行 为 ,语言行为是语言能力的表现 ,因此语言测 试是通过对语言行为的测量来推论受试的语 言能力 。另一方面 , 语言测试只可能在有限 的时间内进行 , 不可能测试到受试的全部语 言行为 ,从统计学的角度来说也没有这个必 要 ,而只需要对受试的全部可能的语言行为 进行有效抽样 。有效样本必须满足三个条 件 ,即样本要有代表性 、 样本要有足够大的 量、 抽样要有随机性 。满足了这些条件 ,有效 样本可以反映总体的统计特征 。这是语言测 试的实质 ,对此李筱菊教授有非常精辟的论 述 ( 李筱菊 1997∶ -
 43) 。图 1 中 A 表示需 39 要测量的交际语言能力 ,但是无法直接观察 ;
B 是凭这种能力所能做到全部语言行为 。如
我国的大学英语四 、 六级考试于 1987 年 起步 。其目的是推动 《大学英语教学大纲》 的 贯彻执行 ,并考核修完大学英语四 、 六级课程 的学生的英语语言水平 。 目前的大学英语四 、 六级考试语言能力 结构模型中 ,分立语言测试 、 综合语言测试以 及交际语言测试各占有一定的比例 , 反映出 大学英语四 、 六级考试设计者对语言测试各 家学派优点的吸收 , 也能窥见语言能力观变 迁所留下的痕迹 。 “由于语言能力 ( 即对语 言知识的掌握 ) 是交际能力的基础 , 因此不 掌握语言能力就谈不上发展语言交际能力 。 在语言测试方面 , 分析法可以更好地测试对 语言知识的掌握程度 , 而综合法便于更好地 测量语言运用能力 ,因此两者不应互相排斥 , 而应当互相补充 。( 杨惠中 ,Weir 1998∶ ) 在 ” 60 大学英语四 、 六级考试中一直包括有词汇语 法知识部分 、 综合填充部分和文章改错部分 , 就是这一观点的具体表现 。前者考查语言能 力 ,使用分析法测试 ; 后两者测量语言综合运 用能力 ,使用的是综合法测试 。在听力和阅 读理解部分更是将二者融为一体 。听力和阅 读虽然只是单向的语言信息吸收 , 但也是一 种语言交际活动 ,何况没有正确的输入 ,输出 又从何谈起呢 ? ( 大学英语四 、 六级考试的 “作文”书面表 ( 达) 和 “英语口语考试” CET2SET) , 则是一种 交互式的 “交际语言能力” 测试 , 前者测量的 是书面交际能力 ( 看材料 ,写文章) ,后者则完 全在一个真实的英语交际情景中发生 , 测量 的是口头交际能力 。
 1. 2 语言测试是采样过程 在定义了所测量的语言能力以后 , 还有 如何测量的问题 ,这涉及到语言测试的信度 ,
果 a 是对交际语言能力 A 的有效抽样 , 又如 果 b 是对全部可能的语言行为 B 的有效抽 样 ,那么语言测试就是通过 b 来最终推论出 受试的交际语言能力 A 。
考试结果通常用成绩来进行报道 ( 图 1 中的 F) 。如果分数是对被测量的语言行为 抽样的正确表示 , 则可以通过分数来推论出 受试的语言能力 。
 2. 分数的可解释性 考试的最终结果是以分数的形式报道考 生成绩 ,这就涉及分数的可解释性问题 。如 果分数任意性很大而且又不可解释 , 那么这 样的考试就没有什么意义 。 对于科学的考试来说 , 考试的分数必须 满足以下条件 :
 1) 反映考试的效度 ;
 2) 反映考 ・63 ・
外语界 2001 年第 1 期 ( 总第 81 期)
试的信度 ;
 3) 反映测量的精度 ;
 4) 分数具有可 解释性 ;
 5) 体现测量的公正性 。 成绩报道要力求做到信息量大 、 标准可 靠、 清晰明白 ,还要公平公正 。大规模考试往 往有广泛的社会影响 , 一项考试在社会上的 权重越大 ,则考试结果所产生的社会后果也 越大 , 考试也就成为高风险考试 ( high2stake tests) 。确保考试的信度和效度 , 确保测量的 精度和测量的公正性 , 使考试的分数不但可 以解释而且可以准确地推论出受试的语言能 力 ,这是语言测试工作者的社会责任 。 为此 ,大规模标准化考试一般不采用原 始分 ( 即答对题数 ) 来报道考生成绩 , 因为这 样做分数的信息量太小 , 通常要进行一系列 的分数转换过程 , 使最后报道的分数不但信 ・64 ・
  其中数据输入后的数据处理包括三个部 分:
 1) 客观题部分首先要作加权处理 ,加权 反映了语言测试设计者对语言能力不同部分 的不同要求 ,反映了对不同教学目标的侧重 。 大学英语四 、 六级考试中阅读能力 、 听力 、 词 汇语法等各个部分每答对一题的得分都是不 同的 。在经过加权处理后 , 还要对客观题部 分用 IRT ( 试题响应理论 ) 模型作等值处理 , 以滤除不同考次间题目难易变化对得分的影 响 。尽管大学英语四 、 六级考试的全部题目 在实际使用前都要经过 “命题 ? 审题 ? 试题 项目分析 ? 复审 ? 构卷” 的漫长过程 ,在实考 前整个试卷的难易度均已得到控制 , 但预测 是在考生中抽样进行的 , 与实考结果难免会 有所差异 ,这些差异须要通过 IRT 等值处理 加以滤除 ,不能因题目难易而影响考生得分 , 这样做也保证了不同考次之间分数的可比 性;
 2) 主观题部分 ,如作文 ,要通过调整以滤 除阅卷员主观因素的影响 。为了保证阅卷员 的阅卷信度 ( 包括阅卷员本人的评分一致性 、 阅卷员之间的评分一致性 、 阅卷点之间的评 分一致性) , 大学英语四 、 六级考试采取了一 系列措施 ,包括制定明确的评分标准 、 确定评 ( range2finders) 、 分参照卷 严格的阅前培训 、 阅 卷过程随机抽查等等 。在采取以上这些有效 措施后依然存在的误差可以称为系统误差 , 大学英语四 、 六级考试开发了一套软件系统 , 根据考生在主 、 客观题上得分的相关性进行 调整 ,以滤除系统误差 。实践证明大学英语 四、 六级考试作文部分的阅卷信度相当高 ;
 3) 分数的正态化处理 。大学英语四 、 六 级考试是一种尺度相关 ? 常模参照考试 。它 以一定的常模为参照 ,大学英语四 、 六级考试 的记分体制采用正态分制 。
 3. 记分体制 大规模标准化考试通常采用以下记分体 制:
息量大而且具有可解释性 。 大学英语四 、 六级考试每次考试结束后 到发布考试成绩之前 , 要经过一系列的统计 处理 ,分为数据输入 、 数据处理 、 成绩计算及 统计分析三部分 ,其流程如图 2 所示 。
Foreign L anguage World No. 1 2001 ( General Serial No.
 81)
  ) 正态分制 ( normal score scale) 1 考生成绩有好有差 , 这是客观存在 。一 项科学的考试应当能够把考生成绩的差异表 现出来 ,按成绩好坏进行客观而准确的排序 。 对于大规模考试来说 , 考生的能力一般呈正 态分布 ,这可以用均值和标准差来进行描述 。 正态分就是用考生在考生总体中的相对位置 来表示考生成绩 , 也就是用均值和标准差来 表示考生成绩 。因此这是一种间接可解释的
记分体制 ,但分数的信息量大 ,且分数具有可 比性 。以 TOEFL 记分体制为例 ,其报道分以 500 分为均值 , 以 70 分为标准差 ( 如图 3 所 示) 。如果某考生得 500 分 ,则在全世界每年 约 84 万考生中优于 50 %的考生 ; 得 570 分 , 优于
 84. 1 %的考生 ; 从另一方面讲 , 如果把 攻读学位的英语要求定位于 TOEFL 550 分 , 则意味着只选拔全体考生中英语成绩最好的 20 %左右的考生 。可见正态分制不但信息量 大 ,而且十分便于用户使用 。此外 ,由于对大 规模的教育现象来说不可能出现考生成绩突 变 ,因此通过等值处理不但可以使不同考次 的分数具有可比性 , 而且可以使分数的解释 具有稳定性 , 逐步地就使分数除了选拔性外 也获得了间接的可解释性 。 正态分制主要用于常模参照测试 ( norm2 referenced tests) 。 ・65 ・
图3
Band 9 Expert User. Has fully operational command of the language : appropriate , accurate and fluent with complete un 2 derstanding. tion well. ing. likely to make many mistakes. Should be able to handle basic communication in own field. Band 4 Limited User. Basic competence is limited to familiar situations. Has frequent problems in understanding and ex 2 pression. Is not able to use complex language. breakdowns in communication occur. written English. Band 1 Non User. Essentially has no ability to use the language beyond possibly a few isolated words. Band 0 Did not attempt the test . No assessable information. misunderstandings in some situations. Generally handles complex language well and understands detailed reason 2 misunderstandings. Can use and understand fairly complex language , particularly in familiar situations. and inappropriacies. Misunderstandings may occur in unfamiliar situations. Handles complex detailed argumenta 2
Band 8 Very Good User. Has fully operational command of the language with only occasional unsystematic inaccuracies
Band 7 Good User. Has operational command of the language , though with occasional inaccuracies , inappropriacies and
B
 

相关内容

大学英语四六级考试政策分析

  3A 学习网中国最专业的学习网站 大学英语四六级考试政策分析 热烈讨论,可谓仁者见仁、 智者见智。出现了如“加强论”和“取消论”等完全相反的意见。因此,有必要从 政策分析角度对之予以全面研究。 1.1.2 为什么要对大学英语四六级考试进行政策研究? 公共政策学是对国家的外交政策、军事政策、国防政策、卫生、福利、体育、 环保政策进行研究,其中包括教育政策。大学英语四六级考试作为一项教育政策, 属于公共政策的范畴。 目前有关大学英语考试的文章在网上超过千篇,有关专著也有几本,但是大都 探讨的是大 ...

大学英语四六级考试的写作方法指导

  大学英语四六级考试的写作方法指导 一、语言第一位 四、六级写作重点考查考生的英语(论坛)表达能力。阅卷老师最重视的是语言,考生最需要提高的 也是语言。有的同学以为使用一些高难词汇就能取得高分,其实不然。中英文写作都讲究“平淡如水”、“简 洁就是美”、“绚烂之极,归于平淡”。美国作家海明威经常使用小学词汇,但他是诺贝尔文学奖的得主,可 见语言的好坏不在词藻的华丽与否,而在于使用得是否得当。中学词汇用好了,完全可以取得各种英语写 作考试的满分。当然基础较好的同学,恰当使用高难词汇有助于提高分数。 ...

09年英语四六级考试时间、流程、题型、分数分配及查分

  年英语四六级考试时间,流程,题型, 引用 09 年英语四六级考试时间,流程,题型,分数分配及查分 默认分类 2009-12-04 10:36:42 阅读 53 评论 0 字号:大中小 引用 Fredda 的 09 年英语四六级考试时间,流程,题型,分数分配及查分 以下是四六级考试时间及流程, 以下是四六级考试时间及流程,请即将参加考试的考生务必铭记于 心.平时训练时请按流程调整好自己的做题时间.考试将至,预祝大家 平时训练时请按流程调整好自己的做题时间.考试将至, 取得自己满意的成绩.祝君好 ...

大学英语四级考试

  大学英语四级考试( 大学英语四级考试(CET 4) ) (恩波英语研究所命题) 恩波英语研究所命题) COLLEGE ENGLISH TEST ?Band Four? 试题册 (125 分钟) 恩波英语模考试卷Part Ⅰ Writing(30 minutes) 注意: 注意:此部分试题在答题卡 1 上。 Part Ⅱ Reading Comprehension(Skimming and Scanning)(15 minutes) Directions: In this part, yo ...

大学英语四级考试流程

  大学英语四级考试流程 8:509:00试音时间 9:009:10播放考场指令, 发放作文考卷 9:10取下耳机,开始作文考试 9:35发放含有快速阅读的试题 册(但9:40才允许开始做) 9:409:55做快速阅读 9:5510:00收答题卡一(即 作文和快速阅读) 9 5510 00 9:5510:00重新戴上耳机, 试音寻台,准备听力考试 10:00开始听力考试,电台开始 放音 听力结束后完成剩余考项。 11:20全部考试结束。 ...

英语四六级考试作文背诵30天

  【大学生电脑主页】?? 大学生电脑主页】 dxsdianano.com 友情提供,欢迎您的光临! 友情提供,欢迎您的光临! 写作模板??提纲式作文 写作模板??提纲式作文 ?? 模版 1 Some people believe (argue, recognize, think) that 观点 1. But other people take an opposite side. They firmly believe that 观点 2. As for me, I agree to the ...

大学英语四、六级考前必须掌握的98词汇

  大学英语四、 词汇(2010-02-19 17:46:52) 大学英语四、六级考前必须掌握的 98 词汇 标签: 标签: 教育 1.accelerate vt. 加速、促进、增加 【例】accelerate the rate of economic growth 加速经济增长 【派】acceleration n. 加速 accelerating a.加速的 2.account n. 账户、考虑、解释 vt.认为、把...视为 【考】take sth. into account 把…考虑在内 ...

2011年大学英语四级考试口试大纲及样题.

  2011 年大学英语四级考试口试大纲 编辑提醒 2011 年上半年大学英语四级考试将在 6 月 18 日 09:00~11:20 举行,下半年将在 12 月 17 日 09:00~11:20 举行,为了帮助大家有效的报考复习,考试大外语站点编辑收集整理了 相关信息供大家参考,希望对大家有所帮助,考试大祝大家顺利通过考试! 考试介绍 考试中心 考试时间 计分规则 报名条件 考试培训 考试大纲 成绩查询 机考解析 证书样张 口试大纲 口语考试成绩合格者由教育部高等教育司发给证书,证书分为 A、 ...

2010年6月英语四六级考试听力四题型分析

  索古特教育 英语:SOGOOD.cn 索古特英语-是一个极力推崇免费英语学习的网站! 索古特英语-是一个极力推崇免费英语学习的网站! 提供英语听力,VOA,口语,双语阅读,全英文短文阅读,行业英语,英语试题 WORD 下载,中高 考英语资料,大学四六级英语,考试英语,英语动画,初中高试题。每日更新!!! 索古特英语学习网:http://www.sogood.cn/ 声明:本资料由 索古特英语[SOGOOD.CN]收集整理,转载请注明出自 http://www.sogood.cn 2010 年 ...

2008年12月英语四六级考试写作技巧及范文

  考试直通车 http://www.ksbus.com 2008 年 12 月英语四六级考试写作技巧及范文 最专业的学习资料下载网站 http://www.NewDown.com.cn 欢迎下载 http://www.newdown.com.cn 的学习资料,为了您的电脑更安全,请 的学习资料,为了您的电脑更安全, http://w 下载本站资料,其他网站下载的资料, 从 http://www.newdown.com.cn 下载本站资料,其他网站下载的资料,均为非 法盗链,并且不能保证您的电脑 ...

热门内容

高职英语教学论文:高职英语听力教学现状及对策分析

  文章源于科技论文发表网:www.59168.net QQ:1003 59168 高职英语教学论文: 高职英语教学论文:高职英语听力教学现状及对策分析 摘要:英语听力对学习英语至关重要,但是目前高职学 摘要 生在学习英语过程中普遍存在着听力差的问题。本文从几个 方面分析了高职英语听力学生学习现状,并对如何利用我们 现有的条件来提高学生的听力进行了探究。 关键词:听力教学,听力水平,对策 关键词 听是人们交流的重要手段。听力教学既是一种语言学 习,又是一种技能培养。在听、说、读、写四种技能中,听 ...

全新版大学英语第二册期中考试备选试题

  全新版大学英语第二册期中考试备选试题 100 points, 90 minutes 及 问卷调查 页交回) (请将 17-20 页交回) 1 Part I Listening comprehension (20 points, 15 minutes) 试题一 Section A 1. A. Go to a movie. B. Work in the library C. Visit a museum. D. Spend some time outdoors. 2. A. They are t ...

新课程标准下的中学英语阅读

  新课程标准下的中学英语 阅读 南京外国语学校? 南京外国语学校?朱善萍 新课程标准阅读部分解读 三级: 朗读, 书面指令,大意,工具书 4万词以上(不包含教科书) 四级:朗读,说明文和信件等应用文体, 大意,猜词(上下文),图表,事件 顺序和人物行为,工具书 10万词以上(不包含教科书) 五级:猜测词义(上下文和构词法),篇章结构 中的逻辑关系,主题情节与预测,常见体 裁,简单策略运用,工具书 15万词以上 新课程标准阅读部分解读(2 新课程标准阅读部分解读(2) 六级:摄取主要信息和观 ...

高考英语作文模版

  高考英语作文模版 (05?江西) 人们对于学生网上交友持不同意见.请你用英语写一篇关于学生网上交友的短文,介绍人们的 不同观点,并表达自己的看法. 赞成的理由 反对的理由 你的看法 1.广交朋友 2.可自由表达思想 3.利于外语学习 1.浪费时间 2.影响学习 3.可能上 当受骗 词数为 100 左右..参考词汇: 网络朋友 on-line friend(s),上当受骗 to be cheated 【参考范文】 Should students make friends on line? So ...

初中英语短语词组归纳

  [短语、词组归纳] 短语、词组归纳] 由动词开头构成的短语、词组很多。复习时应分类处理: 一、动词+介词 1.look at…看…, look like … 看上去像……, look after …照料… 2.listen to…听…… 3.welcome to…欢迎到…… 4.say hello to …向……问好 5.speak to…对……说话 此类短语相当于及物动词,其后必须带宾语,但宾语无论是名词还是代词,都要放在 介词之后。 二、动词+副词 “动词+副词”所构成的短语义分为两类: ...