外语界 2001 年第 1 期 ( 总第 81 期)
大学英语四 、 六级考试分数解释
□ 杨惠中     金 艳
提要 : 本文作者从考试的效度和信度出发 ,论证了设计一项有效考试必须首先定义所要测量的语言能力结 构 。由于考试结果通常用分数来表达 ,因此作为科学的考试其分数必须具有可解释性 ,分数解释又涉及记分 体制 。为了使分数带有大量信息 ,便于用户使用 ,大规模标准化考试在最终报道考试成绩前 ,分数要经过加权 处理 、 等值处理 、 正态化转换等一系列转换过程 。作者接着说明了大学英语四 、 六级考试的分数解释和分数使 用。 关键词 : 分数可解释性 ; 记分体制 ; 大学英语四 、 六级考试 ; 尺度相关 - 常模参照考试
Abstract : This paper starts from defining the construct to be measured in the CET tests , predicted by the necessity of ensuring
pretable , which involves the use of a certain scoring system. In large2scale standardized tests , the test scores , before release , have to undergo a series of transformation processes , including score weighting , score equating , and score normalization , etc. , the CET test scores are interpreted and used. the reliability and validity of a test. Since the test results are usually reported in the form of test scores , they must be inter 2 in order to provide as much feedback information as possible to the end users of the test. The authors then explain in detail how
中图分类号 : H3
  10. 42   文献标识码 : C   文章编号 : 1004 - 5112 (20
  01) 01 - 0062 - 07

  1. 效度 、 信度与考试成绩报道

  1. 1 定义所测量的语言能力结构
行客观的 、 准确的 、 公正的评价 。由于语言能 项简单的任务 。
力是一种心理量 , 要做到这一点显然不是一
要测量语言能力首先要定义所测量的语 言能力结构 ( the construct to be measured) , 这 涉及一项语言测试的效度 。效度回答的是 题 ,不同的语言观和语言能力学说决定了语 言测试的内容不同 , 测试方法也不同 。可以
“一项语言测试考的是什么语言能力 ?” 的问
说语言测试是一定的语言观的具体实施与操 作 (operationalization) 。 语言测试的历史并不长 , 但已经经历了
前科学时期 、 心理测量 ? 结构主义时期 、 总体 综合法时期和心理语言学 ? 社会语言学时 ・62 ・
Key words : score interpretability ; scoring systems ; the CET tests ; criterion2related norm2referenced tests
期 ,这一发展历程是和语言学的发展同步的 。 在当前国际语言测试界 , 得到广泛接受的是
语言测试的任务是对考生的语言能力进
Bachman 教授等所提出的交 际 语 言 能 力 学
说 。他认为语言交际能力 “包括两个部分 : 语 ( language competence) , 或称语言知识 , 言能力
和 元 认 知 策 略 ( meta2cognitive strategies ) ” (Bachman 1996∶ ) 。他说 “语言知识可以看 67 : 作记忆中的一个信息域 , 在语言使用中产出 或解释话语时供元认知策略调用 。语言知识 包 括 两 大 类 : 结 构 组 织 知 识 ( organizational
knowledge) 和语用知识 。 ” “语用知识使我们能
够把说出的话 、 句子 、 篇章与意义关连起来 ,
与用户的交际意图关连起来 , 与相关的语言
情景关连起来 , 从而产出或理解话语 。语用
知识有两个方面 : 语言功能知识和社会语言 知识 。( 同上 , 1996∶ ) Bachman 指出 “语言 ” 69 : 使用者在产出和理解话语时把所有这些方面
Foreign L anguage World No. 1 2001 ( General Serial No.
  81)
的能力综合起来 ,使话语适合一定的情景 ,正 是这种能力使语言的使用成为可能 。 ( 同上 ” 1996∶ ) 70
Bachman 等的交际语言能力学说提出于 90 年代初 ,到 90 年代中成熟 。
也涉及语言测试的效度 。语言能力本身无法 直接观察 ,能够观察到的只是使用语言的行 为 ,语言行为是语言能力的表现 ,因此语言测 试是通过对语言行为的测量来推论受试的语 言能力 。另一方面 , 语言测试只可能在有限 的时间内进行 , 不可能测试到受试的全部语 言行为 ,从统计学的角度来说也没有这个必 要 ,而只需要对受试的全部可能的语言行为 进行有效抽样 。有效样本必须满足三个条 件 ,即样本要有代表性 、 样本要有足够大的 量、 抽样要有随机性 。满足了这些条件 ,有效 样本可以反映总体的统计特征 。这是语言测 试的实质 ,对此李筱菊教授有非常精辟的论 述 ( 李筱菊 1997∶ -
  43) 。图 1 中 A 表示需 39 要测量的交际语言能力 ,但是无法直接观察 ;
B 是凭这种能力所能做到全部语言行为 。如
我国的大学英语四 、 六级考试于 1987 年 起步 。其目的是推动 《大学英语教学大纲》 的 贯彻执行 ,并考核修完大学英语四 、 六级课程 的学生的英语语言水平 。 目前的大学英语四 、 六级考试语言能力 结构模型中 ,分立语言测试 、 综合语言测试以 及交际语言测试各占有一定的比例 , 反映出 大学英语四 、 六级考试设计者对语言测试各 家学派优点的吸收 , 也能窥见语言能力观变 迁所留下的痕迹 。 “由于语言能力 ( 即对语 言知识的掌握 ) 是交际能力的基础 , 因此不 掌握语言能力就谈不上发展语言交际能力 。 在语言测试方面 , 分析法可以更好地测试对 语言知识的掌握程度 , 而综合法便于更好地 测量语言运用能力 ,因此两者不应互相排斥 , 而应当互相补充 。( 杨惠中 ,Weir 1998∶ ) 在 ” 60 大学英语四 、 六级考试中一直包括有词汇语 法知识部分 、 综合填充部分和文章改错部分 , 就是这一观点的具体表现 。前者考查语言能 力 ,使用分析法测试 ; 后两者测量语言综合运 用能力 ,使用的是综合法测试 。在听力和阅 读理解部分更是将二者融为一体 。听力和阅 读虽然只是单向的语言信息吸收 , 但也是一 种语言交际活动 ,何况没有正确的输入 ,输出 又从何谈起呢 ? ( 大学英语四 、 六级考试的 “作文”书面表 ( 达) 和 “英语口语考试” CET2SET) , 则是一种 交互式的 “交际语言能力” 测试 , 前者测量的 是书面交际能力 ( 看材料 ,写文章) ,后者则完 全在一个真实的英语交际情景中发生 , 测量 的是口头交际能力 。
  1. 2 语言测试是采样过程 在定义了所测量的语言能力以后 , 还有 如何测量的问题 ,这涉及到语言测试的信度 ,
果 a 是对交际语言能力 A 的有效抽样 , 又如 果 b 是对全部可能的语言行为 B 的有效抽 样 ,那么语言测试就是通过 b 来最终推论出 受试的交际语言能力 A 。
考试结果通常用成绩来进行报道 ( 图 1 中的 F) 。如果分数是对被测量的语言行为 抽样的正确表示 , 则可以通过分数来推论出 受试的语言能力 。
  2. 分数的可解释性 考试的最终结果是以分数的形式报道考 生成绩 ,这就涉及分数的可解释性问题 。如 果分数任意性很大而且又不可解释 , 那么这 样的考试就没有什么意义 。 对于科学的考试来说 , 考试的分数必须 满足以下条件 :
  1) 反映考试的效度 ;
  2) 反映考 ・63 ・
外语界 2001 年第 1 期 ( 总第 81 期)
试的信度 ;
  3) 反映测量的精度 ;
  4) 分数具有可 解释性 ;
  5) 体现测量的公正性 。 成绩报道要力求做到信息量大 、 标准可 靠、 清晰明白 ,还要公平公正 。大规模考试往 往有广泛的社会影响 , 一项考试在社会上的 权重越大 ,则考试结果所产生的社会后果也 越大 , 考试也就成为高风险考试 ( high2stake tests) 。确保考试的信度和效度 , 确保测量的 精度和测量的公正性 , 使考试的分数不但可 以解释而且可以准确地推论出受试的语言能 力 ,这是语言测试工作者的社会责任 。 为此 ,大规模标准化考试一般不采用原 始分 ( 即答对题数 ) 来报道考生成绩 , 因为这 样做分数的信息量太小 , 通常要进行一系列 的分数转换过程 , 使最后报道的分数不但信 ・64 ・
   其中数据输入后的数据处理包括三个部 分:
  1) 客观题部分首先要作加权处理 ,加权 反映了语言测试设计者对语言能力不同部分 的不同要求 ,反映了对不同教学目标的侧重 。 大学英语四 、 六级考试中阅读能力 、 听力 、 词 汇语法等各个部分每答对一题的得分都是不 同的 。在经过加权处理后 , 还要对客观题部 分用 IRT ( 试题响应理论 ) 模型作等值处理 , 以滤除不同考次间题目难易变化对得分的影 响 。尽管大学英语四 、 六级考试的全部题目 在实际使用前都要经过 “命题 ? 审题 ? 试题 项目分析 ? 复审 ? 构卷” 的漫长过程 ,在实考 前整个试卷的难易度均已得到控制 , 但预测 是在考生中抽样进行的 , 与实考结果难免会 有所差异 ,这些差异须要通过 IRT 等值处理 加以滤除 ,不能因题目难易而影响考生得分 , 这样做也保证了不同考次之间分数的可比 性;
  2) 主观题部分 ,如作文 ,要通过调整以滤 除阅卷员主观因素的影响 。为了保证阅卷员 的阅卷信度 ( 包括阅卷员本人的评分一致性 、 阅卷员之间的评分一致性 、 阅卷点之间的评 分一致性) , 大学英语四 、 六级考试采取了一 系列措施 ,包括制定明确的评分标准 、 确定评 ( range2finders) 、 分参照卷 严格的阅前培训 、 阅 卷过程随机抽查等等 。在采取以上这些有效 措施后依然存在的误差可以称为系统误差 , 大学英语四 、 六级考试开发了一套软件系统 , 根据考生在主 、 客观题上得分的相关性进行 调整 ,以滤除系统误差 。实践证明大学英语 四、 六级考试作文部分的阅卷信度相当高 ;
  3) 分数的正态化处理 。大学英语四 、 六 级考试是一种尺度相关 ? 常模参照考试 。它 以一定的常模为参照 ,大学英语四 、 六级考试 的记分体制采用正态分制 。
  3. 记分体制 大规模标准化考试通常采用以下记分体 制:
息量大而且具有可解释性 。 大学英语四 、 六级考试每次考试结束后 到发布考试成绩之前 , 要经过一系列的统计 处理 ,分为数据输入 、 数据处理 、 成绩计算及 统计分析三部分 ,其流程如图 2 所示 。
Foreign L anguage World No. 1 2001 ( General Serial No.
  81)
   ) 正态分制 ( normal score scale) 1 考生成绩有好有差 , 这是客观存在 。一 项科学的考试应当能够把考生成绩的差异表 现出来 ,按成绩好坏进行客观而准确的排序 。 对于大规模考试来说 , 考生的能力一般呈正 态分布 ,这可以用均值和标准差来进行描述 。 正态分就是用考生在考生总体中的相对位置 来表示考生成绩 , 也就是用均值和标准差来 表示考生成绩 。因此这是一种间接可解释的
记分体制 ,但分数的信息量大 ,且分数具有可 比性 。以 TOEFL 记分体制为例 ,其报道分以 500 分为均值 , 以 70 分为标准差 ( 如图 3 所 示) 。如果某考生得 500 分 ,则在全世界每年 约 84 万考生中优于 50 %的考生 ; 得 570 分 , 优于
  84. 1 %的考生 ; 从另一方面讲 , 如果把 攻读学位的英语要求定位于 TOEFL 550 分 , 则意味着只选拔全体考生中英语成绩最好的 20 %左右的考生 。可见正态分制不但信息量 大 ,而且十分便于用户使用 。此外 ,由于对大 规模的教育现象来说不可能出现考生成绩突 变 ,因此通过等值处理不但可以使不同考次 的分数具有可比性 , 而且可以使分数的解释 具有稳定性 , 逐步地就使分数除了选拔性外 也获得了间接的可解释性 。 正态分制主要用于常模参照测试 ( norm2 referenced tests) 。 ・65 ・
图3
Band 9  Expert User.  Has fully operational command of the language : appropriate , accurate and fluent with complete un 2 derstanding. tion well. ing. likely to make many mistakes. Should be able to handle basic communication in own field. Band 4  Limited User. Basic competence is limited to familiar situations. Has frequent problems in understanding and ex 2 pression. Is not able to use complex language. breakdowns in communication occur. written English. Band 1  Non User. Essentially has no ability to use the language beyond possibly a few isolated words. Band 0  Did not attempt the test . No assessable information. misunderstandings in some situations. Generally handles complex language well and understands detailed reason 2 misunderstandings. Can use and understand fairly complex language , particularly in familiar situations. and inappropriacies. Misunderstandings may occur in unfamiliar situations. Handles complex detailed argumenta 2
Band 8  Very Good User. Has fully operational command of the language with only occasional unsystematic inaccuracies
Band 7  Good User. Has operational command of the language , though with occasional inaccuracies , inappropriacies and
B
 

相关内容

大学英语四六级考试政策分析

   3A 学习网中国最专业的学习网站 大学英语四六级考试政策分析 热烈讨论,可谓仁者见仁、 智者见智。出现了如“加强论”和“取消论”等完全相反的意见。因此,有必要从 政策分析角度对之予以全面研究。 1.1.2 为什么要对大学英语四六级考试进行政策研究? 公共政策学是对国家的外交政策、军事政策、国防政策、卫生、福利、体育、 环保政策进行研究,其中包括教育政策。大学英语四六级考试作为一项教育政策, 属于公共政策的范畴。 目前有关大学英语考试的文章在网上超过千篇,有关专著也有几本,但是大都 探讨的是大 ...

大学英语四六级考试分数解释

   外语界 2001 年第 1 期 ( 总第 81 期) 大学英语四 、 六级考试分数解释 □ 杨惠中     金 艳 提要 : 本文作者从考试的效度和信度出发 ,论证了设计一项有效考试必须首先定义所要测量的语言能力结 构 。由于考试结果通常用分数来表达 ,因此作为科学的考试其分数必须具有可解释性 ,分数解释又涉及记分 体制 。为了使分数带有大量信息 ,便于用户使用 ,大规模标准化考试在最终报道考试成绩前 ,分数要经过加权 处理 、 等值处理 、 正态化转换等一系列转换过程 。作者接着说明了大学 ...

6月大学英语四级考试听力复习指导(3)_英语四级-英语六级-cet_百度文库...

   本文由uknow119955820贡献 6月大学英语四级考试听力复习指导(3)_英语四级-英语六级-cet? 爱词霸英语 汉语 手机版 软件版下载 | English 每日一句:I feel like celebrating tonight. 我今晚想庆祝一…… 彩信订阅登录 | 注册词典 翻译 句库 情景会话 沙龙 学习资料 娱乐 金山词霸 免费英语 更多 英语测验 个人空间 免费工具 更多>>口语 双语新闻 CRI 四六级 考研英语 出国留学 雅思 ...

大学英语四级考试

   Breakfast or Internet Karl and Dorsey Gude of East Lansing, Michigan, USA, can remember simpler mornings, not too long ago. They sat together and chatted as they ate breakfast at home. They read the newspapers and competed only with the television ...

英语四六级-菜鸟学英语

   Baobab 的学英语经历 菜鸟学英语 前言 这是一本菜鸟写的书,亦是写给菜鸟们看的书. 这两年,我一直都在旺旺英语论坛答疑,写些英语学习的心得体会,平常也时常指 点他人如何自学,偶尔还被请到某某外语学校做报告,不过一直都没敢想过有天会写英 语学习的书:首先,我的英语不怎么样;其次,我没有名气,也没有取得什么成就.这 样的菜鸟,有什么资格写书?又会有什么人读呢? 直到有天,读到了一位大学英语老师写的英语学习的书.这位老师英文非常好,遗 憾的是,在他书中只给出宏观的一些指导,并未给出具体的方法 ...

英语四六级考试备考经验

   英语四六级考试备考经验 备考英语四六级首先要明确四个重点:听力,阅读,词汇和真题。听力和阅读是就题型 重要性来说的。在所有题型中,他们是分值最高的。因此,在有限的时间内,应该重点突破 这两部分。 当然, 有的学生可能听力是强项, 作文失分多, 那么自然应该多下力气在弱项上, 因人而异。掌握好听力和阅读的前提是词汇量的积累。词汇的记忆虽然并不复杂,但是由于 单词多而散,需要重复和持久性记忆,常常成为最让学生头疼的事。因此,有必要在这方面 花功夫。对于四六级考试来说,最宝贝的工具就是历年真题。虽 ...

英语四六级考试作文背诵30天

   【大学生电脑主页】?? 大学生电脑主页】 dxsdianano.com 友情提供,欢迎您的光临! 友情提供,欢迎您的光临! 写作模板??提纲式作文 写作模板??提纲式作文 ?? 模版 1 Some people believe (argue, recognize, think) that 观点 1. But other people take an opposite side. They firmly believe that 观点 2. As for me, I agree to the ...

大学英语四、六级考前必须掌握的98词汇

   大学英语四、 词汇(2010-02-19 17:46:52) 大学英语四、六级考前必须掌握的 98 词汇 标签: 标签: 教育 1.accelerate vt. 加速、促进、增加 【例】accelerate the rate of economic growth 加速经济增长 【派】acceleration n. 加速 accelerating a.加速的 2.account n. 账户、考虑、解释 vt.认为、把...视为 【考】take sth. into account 把…考虑在内 ...

学习【大学英语四级考试流程以及各类考试时间】

   大学英语四级考试流程 8:509:00 试音时间 9:009:10 播放考场指令,发放作文考卷 9:10 取下耳机,开始作文考试 9:35 发放含有快速阅读的试题册(但 9:40 才允许开始做) 9:409:55 做快速阅读 9:5510:00 收答题卡一(即作文和快速阅读) 9:5510:00 重新戴上耳机,试音寻台,准备听力考试 10:00 开始听力考试,电台开始放音 听力结束后完成剩余考项。 11:20 全部考试结束。 注释 1,标准分满分 710 分=听力 248.5+阅读 248. ...

2010年6月英语四六级考试听力四题型分析

   索古特教育 英语:SOGOOD.cn 索古特英语-是一个极力推崇免费英语学习的网站! 索古特英语-是一个极力推崇免费英语学习的网站! 提供英语听力,VOA,口语,双语阅读,全英文短文阅读,行业英语,英语试题 WORD 下载,中高 考英语资料,大学四六级英语,考试英语,英语动画,初中高试题。每日更新!!! 索古特英语学习网:http://www.sogood.cn/ 声明:本资料由 索古特英语[SOGOOD.CN]收集整理,转载请注明出自 http://www.sogood.cn 2010 年 ...

热门内容

新东方英语四级爵以词雄 词汇

   新东方在线 [www.koolearn.com] 网络课堂电子教材系列 爵以词雄-四级 爵以词雄 四级 4000 词汇 爵以词雄-四级 爵以词雄 四级 4000 词汇 第一回: 第一回:你为什么记不住单词 你为什么记不住单词( 第一段 你为什么记不住单词(上) 开场白:死记硬背是无奈,盲人摸象是无知,我劝天下睁开眼,且听一男讲单词! 开场白:死记硬背是无奈,盲人摸象是无知,我劝天下睁开眼,且听一男讲单词!各位新 东方网络课堂的学员你们好,我是一名北京新东方学校国内考试部的英语单词速记教师. ...

浅析大学英语四级考试写作中的语篇连贯性

   第2 6卷 第 2期  Vo _ 6 No 2 l2   .   吕梁高等专科学校学报  J u a fL l n   g e  l g  o r lo  vi gHih rCol e n a e 21 0 0年 6月  J n 2 1  u .00 浅析 大 学 英语 四级考 试 写 作 中 的语 篇连 贯 性  刘  英  ( 吕梁 学 院 公 共 外 语 教研 部 , 西 离石 0 30 ) 山 3 00  摘 要: 语篇连贯性在大 学四级考试写作 中 占有非常重要 的比重 , 而低 ...

朗文当代高级英语辞典和牛津高阶英汉双解词典...

   《朗文当代高级英语辞典》和《牛津高阶英汉双解词典》 第 朗文当代高级英语辞典》 牛津高阶英汉双解词典》 高阶英汉双解词典 ( 四版) 四版)在语音方面的比较 作为全面的大型工具书, 《朗文当代高级英语辞典》和《牛津高阶 英汉双解词典》至出版以来一直受到读者的青睐,并经过多次修订不 断更新完善深受读者的好评。好的工具书就像一座知识宝库,内容翔 实,包罗万象。这两部词典不仅提供了与词汇有关的语音、语义、语 法等方面的知识以便于词汇的理解和掌握,而且提供了必要的语用指 导。无论从内容还是形式上,两 ...

英语教学教法

   一、单项选择题(在每小题的备选答案中选出一个正确的答案,并将正确的号码填在题干的 括号内。每小题 1 分,共 30 分) 1、运用某语法规则来理解外语,是认识策略中的( )策略。 A 求解证实 B 猜测和概括 C 演绎推理 D 实践 E 记忆 F 监控 2、鲁斌按策略是否对学习过程直接产生影响为标准,把学习者策略分为“学习策略”“沟 、 通策略”和( ). A 社交策略 B 情感策略 C 认知策略 D 元认知策略 E 手势策略 F 知识策略 3、说话者自己发明“airball”一词用来表达“ ...

小学英语报刊趣味化浅探

   采编 论 一 一 l ■ ; 小学英 语报 刊 趣味化浅 探 ◎王仁 芳( 国儿 c p 童报 北 京 102) 008 20 0 4年 . 中国 少年 儿 童 新 闻 出 版 总 社 决 定 创办 一 份 以 小 学 生 为 目标 受 第一 招 : 词 看 天 下.先按 照孩 子 单 的 阅 读 兴 趣 做 好选 题 ,然 后 提 取 其 中 的 关 键 词 翻译 成 英 语 ,反 复 在 文 中 复 现 . 完 成 信 息 的到 位 传 达 , 保 证 孩 既 又 根 据 上 ...