《石大教育测量与评价教案10标准化考试.docx》由会员分享,可在线阅读,更多相关《石大教育测量与评价教案10标准化考试.docx(5页珍藏版)》请在优知文库上搜索。
1、第十章标准化考试标准化考试产生于20世纪40年代,至五六十年代达到顶峰时期。标准化考试风行了半个世纪,目前标准化考试已日趋完善,应用也越来越广泛,以致谈到标准化考试几乎无人不知晓。我国从80年代中期开始在广东推行高考标准化考试,现已取得了较大的成绩。虽然“标准化考试”已成为日常生活中的一个常用词,但迄今为止,对什么是标准化考试尚无严格的科学定义。目前对标准化考试的解释甚多,各执一见。但一般认为,标准化考试是一种大规模的、按照系统的科学组织程序、具有统一的标准、并对误差作了严格控制的考试,它指的是考试实施的全过程的标准化,亦即从考试的编制、实施、评分、解释分数到最后制定常模,都要尽量标准化。具体
2、而言,标准化考试要做到以下四个方面的标准化:(1)试题编制过程的标准化;(2)考试实施过程的标准化;(3)评分、计分过程的标准化;(4)分数合成和解释过程的标准化。第一节主观经验性考试的弊端主观经验性是指在考试的整个过程中,带有少数人的很强的主观随意性,亦即从命题到最后的评分以及分数的解释都受到有关人员的主观因素的极大影响。因此,主观经验性考试的质量指标比较低,如果用之作为选拔、评优的参考指标将会产生极大的错误。我国是考试的故乡,目前国际上都公认现在的考试起源于我国公元606年开始实行的,直至本世纪初(1905年)才废止的科举考试制度。科举制度对我国的历史甚至世界文化都产生过巨大的影响,它的很
3、多做法对现在的考试仍有借鉴意义。这在第一章已有论述。科举考试是非常典型的主观经验性考试,从中我们可以得出主观经验性考试存在的主要问题:一、命题的主观性曾有人举了一个科举考试在命题方面的一个非常典型的例子:清乾隆年间曾出过一个诗题,叫做“灯右观书”,是因为考试前一天晚上乾隆读书时,宫监将灯放置右侧,有碍目光,所以随手拟定了这个试题。此例虽然非常特殊,但暴露了主观经验性考试在命题方面的极大随意性。二、评分的误差较大有人讲了一个笑话:西方有位历史教授在评一次历史考试试卷时,误把自己做的标准答案混入了考试的答卷中,等找到时这份“标准答卷”已被另一位教授评了一个不及格的分数。后来,所有参加评卷的教授又把
4、这份“标准答卷”重新认真地评了一遍,结果也是参差不齐,好的有优等,差的有不及格的。评分误差产生的原因很多。有的是由于试题意义含混,引起考生及评分者歧义;有的是考生故意以含糊不清、模棱两可的叙述掩盖知识缺陷,给分数评定带来困难。另外,评分者本人的某些特点也能影响评定分数的客观性。比如,评分者知识水平的影响;评分者心理状况的影响;评分者个性倾向的影响;各种“效应”的影响;评分者工作态度的影响等,都会影响到最后的评分。因此,只要是主观性考试,就肯定存在评分的误差。问题是如何有效地控制评分的误差。这个问题迄今为止,还没有很好地解决。三、分数解释的片面性主观经验性考试的另一弊端是分数解释的片面性。主观经
5、验性考试往往孤立、片面地看待考生的分数,不对之进行科学、合理的转换,因而对分数的解释往往是不准确的。我们知道,原始分数是没有任何意义的。它不能直接加、减、乘、除,进行代数运算,甚至不能比较两科分数的高低。因此,在主观经验性考试中,孤立地看一个分数的高低是片面的、不合理的,也是不科学的。总之,主观经验性考试的质量指标是不高的。第二节标准化考试的特点针对主观经验性考试的以上弊端,人们开始寻找新的考试以克服其缺点。标准化考试就应运而生了。可以说,标准化考试之听以产生,直接原因主要是针对以前的主观经验性考试在考试的实施过程与评分方面存在较大的误差,受到人为因素的较大影响。当然,它的产生还有更为深刻的社
6、会背景一一现代西方社会工业化生产快速发展的影响。人们要求在工农业生产中推行标准化的测量与计量体系,使得测量的过程客观化与测量的结果标准化与统一化。同时,自然科学测量取得了巨大的成就,给教育测量提供了可借鉴之处,也使教育测量方面的教育者受到鼓舞。因此,标准化考试一经诞生,便显示了它的强大威力,受到人们的普遍欢迎。标准化考试有以下四个主要特点,凡不具备其中之不能称之为标准化考试。一、试题编制过程的标准化标准化考试的试题是由有关专家组成的班子集体编制的。在编题前,要明确考试目的,拟出考试大纲,制定编题计划。然后,命题人员根据计划编写好试题,由有关人员对试题进行初步筛选后组织预测,并根据预测的结果来进
7、行统计分析,取得题目的难度、区分度等数据资料,经预测、筛选和修改过的符合要求的题目可以存人题库备用。最后,按考试要求从题库中取出题目拼配试卷。二、考试实施过程的标准化标准化考试对考试的要求是极其严格的,包括对考试的实施环境、考试时间以及考试中可能发生的偶然事件的处理方法、监考人员的要求等各个方面都要尽量做到标准化。只有这样,才能保证公平合理地对待所有考生,提高考试的信度。三、标准化考试的评分、计分方法要标准化评分、计分方法是导致考试结果误差的一个极其重要的因素,是考试的一个十分重要的环节。这一过程如达不到标准化水平,考试也就等于前功尽弃了。非标准化考试正是在这一点上不如标准化考试,从而大大影响
8、了其考试的质量水平。标准化考试的评分都可以用机器或采用记分键来进行,机器阅卷只要编程没有问题,是绝对不会出现错误的。因为电脑属于“爆破性机器”,一旦出现故障,评卷就停止了,只要是正常运行,就不会出现问题。四、标准化考试必须编制常模所谓常模,指的是标准化考试的大样本团体的成绩的平均数,亦即大样本团体分数的一般水平。它是我们比较考生相对水平的参照点。到目前为止,标准化考试还多用于常模参照性测验,即注重考生之间的相互比较,而常模往往是最常用的比较标准,因此,在标准化的常模参照性考试中,必须编制常模,作为解释分数的依据。第三节标准化考试的基本程序标准化考试一般有以下七个最基本的程序。一、编制考试计划二
9、、编制考试初稿编制考试初稿要依据考试大纲进行。一般包括编制考试双向细目表、搜集素材、选择试题、编辑成卷几个环节。1 .编制考试双向细目表2 .搜集素材3 .选择试题4编辑成卷三、预测预测是标准化考试的一个重要环节。初稿的质量如何,能否大规模使用,光凭经验判断是不够的,必须进行预测。预测阶段主要有两项工作:一是预测的组织与实施;二是预测后的质量分析。(一)预测的组织与实施(二)预测的质量分析四、修改考试原稿修改考试原稿一般有以下几项工作要做:1 .剔除不恰当的试题2 .修改不完善的指导语3 .修正试题中的非关键性错误4 .试卷的整体质量分析如词汇、标点5 .确定正式考试试卷及其复本五、制定常模标
10、准化考试一般以常模作为其参照标准。常模一般有年级常模、年龄常模、百分常模和标准分数常模四种。1 .年级常模通过测试大量各个年级的学生,就可获得各年级学生的平均分数,以这些平均分数作为各年级的参照标准,便得到年级常模。年级常模的作用是把个体的成绩与每个年级的一般水平的学生进行对照,以确定他的各科学习成绩处在什么地位上,以便找出其优势和不足。2 .年龄常模年龄常模是以某个年龄的平均得分作为比较的标准,把年龄与平均分数对照。如果某一特征是随着年龄的增长而连续变化的,那么,用年龄常模反映该特征的变化就比较合适。3 .百分常模百分常模是将常模样本的测验分数,编制成反映考生百分等级的相对累积次数分配表即可
11、获得。它的意义明确、计算简便、应用方便,因此适应性强。4 .标准分数常模标准分数常模是根据考生能力呈正态分布的规律,将考试的原始分数转化为标准分数,以此确定其在考生团体中的地位。标准分数是以平均数为参照点,以标准差为单位的相对量数,具有可加性。标准分数常模有多种线性转换形式,比较具有代表性的有标准九分和T分数等,这在第六章已有介绍。标准分数常模是标准化考试中最常使用的一种常模。六、收集考试的信度、效度资料标准化考试一定要收集考试的信度和效度资料,以便使用者做到心中有数。缺乏信度、效度资料的考试是无法得到社会承认的。计算信度、效度的方法可参考本书的第二章。七、编制考试指导手册在标准化考试正式使用
12、之前,要编制出考试指导手册或指南,以指导考试的实施,使考试严格按标准化的程序进行。考试指导手册有两种:一种是专供考试主持者使用的,另一种是供考生使用的。供考试主持者使用的指导手册包括:考试的目的、功用;考试的材料是根据什么原则、应用什么方法选择的;如何实施考试;标准答案、记分方法以及如何评阅试卷的说明;常模表以及如何应用常模解释考试结果的说明;提供考试信度、效度的有关资料;如何应用考试结果的指示,等等。供考生使用的说明书,一般包括考试的目的、内容;回答试题的方法,考试的时间限制;有时,还要附加例题,以帮助考生掌握正确回答试题的方法。这类说明书内容较为简单,而又明确、具体。第四节标准化考试的优缺点标准化考试曾经风行几十年,人们以为找到了考试的最好方法,也以为关于考试的研究达到了顶峰。但是,经过若干年的实践后,人们开始对标准化考试进行深刻的反思。一、标准化考试的优点标准化考试的优点正好弥补了主观性考试的不足之处,概述之,有以下几点:1 .试卷编制的科学性2 .试题取样的代表性3 .评分的客观性二、标准化考试的缺点任何事物都有矛盾着的两个方面,标准化考试也不例外,也存在着难以克服的缺陷:1 .能力测试的片面性2 .题型的僵化性3 .防止考生舞弊的困难性4 .各项质量指标也存在不完善性首先,是效度指标问题。其次,是各项指标的误差问题。再次,是对猜测的校正问题。