《第6章—计算机辅助教育测量与评价概述名师编辑PPT课件.ppt》由会员分享,可在线阅读,更多相关《第6章—计算机辅助教育测量与评价概述名师编辑PPT课件.ppt(40页珍藏版)》请在优知文库上搜索。
1、计算机辅助教育测量与评价目录n1 教育测量与评价的产生n2 计算机辅助评价的定义与分类n3 计算机辅助评价的发展n4 第四代教育评价的兴起1.1 教育测量与评价的产生 1.1 教育测验的兴起 1.2 美国的教育测验运动 1.3 “八年研究”与教育评价的诞生教育测验的兴起n中国古代科举考试制度对世界教育、政治、文化,尤其是考试制度产生过重大的影响。n在教育界引起人们对测验问题以极大关注的是著名的莱斯(JMRice)拼字测验。美国的教育测验运动 教育测验之所以在本世纪二十年代形成一种运动,表面是针对论文或考试不客观,实际上,有更为深刻的原因:n自然科学的发展 n个别差异的研究与统计学在教育上的运用
2、n对特殊儿童的研究 美国的教育测验运动 美国的教育测验运动的发展可分为以下三个时期:n19041915年的开拓期 n19151930年的兴盛期 n19301940年教育测验运动的批判期“八年研究”与教育评价的诞生 为了解决高中课程及教学问题,美国进步主义教育协会负责人艾钦于19331940年期间领导了一项长达八年之久的中学课程改革运动,这就是美国教育史上著名的“八年研究”“八年研究”与教育评价的诞生 为了评价其研究成果,组成了以泰勒为领导的评价委员会。通过这场研究,泰勒和他的同事正式提出了教育评价的概念,即教育评价就是衡量实际活动达到教即教育评价就是衡量实际活动达到教育目标的程度,测验是它的手
3、段。育目标的程度,测验是它的手段。“八年研究”与教育评价的诞生 同时,还提出了评价的原则和方法,其基本思想是:n教育是改变人的行动方式的过程;n教育目标是各种行动方式的变化;n教育能够根据对该目标实际完成情况的分析进行评价;“八年研究”与教育评价的诞生 n人的行动是复杂的,所以要从各方面进行评价,它不仅是分析的,而且也是综合的;n作为评价方法仅仅靠用纸和笔的测验是不充分的,应该采用包括观察行为在内的更为广泛的方法。“八年研究”与教育评价的诞生 表1.1 新旧课程优劣之评价比较 2 计算机辅助评价的定义与分类2.1 计算机辅助评价(CAA)的定义2.2 计算机辅助评价(CAA)的分类计算机辅助评
4、价(CAA)的定义 计算机技术和教育测量与评价思想的融合促进了计算机辅助评价(Computer-AssistedAssessment,简写为CAA)的发展,引发了评价内容、方法和形式的深刻变革。简单地说,凡是借助于计算机程序、软件和设备进行的测试和评价都属于计算机辅助评价的研究领域。计算机辅助评价(CAA)的定义 计算机辅助评价是指在评价学习者的知识、技能和能力的过程中引入计算机作为工具或手段,主要表现在以下几方面:n在测试的过程中,传递材料、评分以及对测试结果进行分析;n比较并分析通过试卷搜集到的数据;n记录并分析学习者的成就水平,生成测评报告;n通过网络比较、分析和传送测评信息。计算机辅助
5、评价(CAA)的定义 就目前应用现状来看,CAA支持的评价类型主要包括下面几种:n诊断性,目的是判断学习者对某个主题的预备知识的掌握程度。n自测,学习者检查自己对某个概念或术语的理解程度。计算机辅助评价(CAA)的定义n形成性,目的是提供反馈来指导学习者的学习,这些反馈表明了学习者对某个主题的知识、技能理解和掌握的程度。在CAA中,形成性评价通常采取客观题的形式,在测评的过程中或者结束立即给出提示和反馈。n总结性,总结性评价能够给出量化分数,并对学习者在某个领域的成绩做出判断。总结性评价通常是正式的、有组织且有监考的评价形式。计算机辅助评价(CAA)的分类 按传递测评内容的手段进行分类,可以分
6、为以下三类:n基于试卷的测评n基于计算机的测评n基于网络的在线测评计算机辅助评价(CAA)的分类 按测评依据的理论模型进行分类,可以分为以下两类:n经典测验理论n项目反应理论 计算机辅助评价(CAA)的分类 与经典测验理论相比,项目反应理论具有以下两个优点:n题目参数估计更准确;n根据信息函数可从题库中抽取符合被试能力的题目进行测试。计算机辅助评价(CAA)的分类 按照测评的题型进行分类,可以分为以下三类:n客观题测评n操作题测评n主观题测评计算机辅助评价(CAA)的分类 客观性测验具有以下一些优点:n测评是客观的,评价结果具有比较高的可信度;n可以快速地给出评价结果;n综合应用多种媒体(图像
7、、视频、音频等),试题的表现形式丰富多样;n在测试的过程中或者测试结束后,可以自动地提供相关的反馈;计算机辅助评价(CAA)的分类 n可以从题库中随机地选择题目;n给学习者提供灵活的自测机会;n可自动阅卷,节省时间,尤其是对大批量学生能快速测评;n从试题的呈现、学生答题到阅卷都可以完全由计算机软件完成,实现无纸化考试。3 计算机辅助评价的发展 3.1 从经典测验(CTT)到项目反应 理论(IRT)3.2 从常模参照测验到标准参照测验3.3 从学业成就到能力素质测验3.4 从终结性评价到形成性评价从经典测验(CTT)到项目反应理论(IRT)经典测量理论、概化理论、项目反应理论是当今主流。一般说来
8、,现在自编量表的测量理论基础都是这三大理论。经典测验理论对测验的分析直观、具体、适用性广;概化理论对测验的宏观分析能力强,适用于测验分析研究;项目反应理论在控制测验编制质量上,原理科学、计量精确,有广泛的发展前途。从经典测验(CTT)到项目反应理论(IRT)经典测量理论(Classical Test Theory,简称CTT)形成于19世纪末,主要是以真实分数模型为基础,借用普通物理测量的基本假设,采用的计算公式简单明了、浅显易懂,能够对测试结果做出合理的解释,并且可操作性强,便于在实际测验情境(尤其是小规模资料)中实施,能满足人们对将测验作为一种选拔工具的需要。从经典测验(CTT)到项目反应
9、理论(IRT)概化理论(Generalizability Theory,简称GT)较之经典测量理论具有独特的优势。它利用方差分析将各类误差进行分解,可辨明多种误差来源,从而揭示了测验变异的影响因素和大小。从经典测验(CTT)到项目反应理论(IRT)项目反应理论(Item ResponseTheory,简称IRT)的发展是建立在潜在特质理论的基础之上的,其主要内容就是揭示被试测验上的反应行为与测验所测的被试潜在特质之间的关系,这种关系的形象描写就是项目特征曲线。从常模参照测验到标准参照测验 尽管在1913年,桑代克就已经提出了标准参照测验,但由于受重视个体差异文化的影响,当时大多数的教育成就测验
10、都是用来比较某个学生与其他学生的成绩,直到20世纪后半叶,标准参照测验得以快速发展。布卢姆的掌握学习理论为标准参照测验的发展提供了原动力。从学业成就到能力素质测验 1993年 “少年儿童测验的应用国际进步之路”宗旨是促进全世界少年儿童的教育发展和教育机会的改善,促进有效的、真正为教育实践服务的评价政策的制定和推行,号召不发达国家开发测验,开展评价,同时倡导发达国家改进传统的评价做法,扩大评价的应用。从终结性评价到形成性评价 终结性评价的目的并不是为了帮助参与方案的个体学生,而是为了决定方案是成功还是失败,是继续使用、修改还是放弃。形成性评价与测验反馈和诊断性功能密不可分。当学生完成了教学的每一
11、个单元或阶段,测验成绩就能够反映他们掌握知识的情况,并告知他们是否达到了课程目标,以及他们在哪些方面需要加强。在教师的帮助下,可以使用新的补习材料或方法来促进学习。4 第四代教育评价的兴起 n4.1 第四代教育评价的内涵n4.2 第四代教育评价的主要方法n4.3 将评价融入学习环境设计第四代教育评价的内涵 “第四代教育评价”的教育评价理论,它是由印地安纳大学教育学院教授枯巴(Egong Cuba)和维德比尔特大学副教授林肯(Yvonna Session Lincoln)创立的。他们于1989年合作出版了第四代教育评价一书,较为系统地论述了他们关于教育评价的观点,依据各种评价出现的先后时间顺序,
12、将教育评价分为四代,并着重阐述了他们所定义的第四代教育评价。他们把教育评价划分为四个发展阶段,认为每一个阶段各有一种理论构建。第四代教育评价的内涵n第一代教育评价被称为教育评价的“测量时代”,这一时代从1900到1930年。主要标志是测量理论的形成和测量技术手段的大量应用,以追求评价结果的数量化、客观化为主要目的。n第二代教育评价被称为教育评价的“描述时代”。这一时代从1930年到1940年。第二代教育评价的主要特征是对评价结果进行描述。n第三代教育评价被称为教育评价的“判断时代”,大约从1950年前后开始,到60年代初期。这一代教育评价的特点,是把前两代没有涉及到的“价值判断”引进了教育评价
13、,并视之为教育评价的关键,评价者的任务不仅是要运用一定的测量手段搜集评价信息,而且还要制定判断价值的目标与评价标准,运用一定手段进行价值判断。第四代教育评价的内涵第四代教育评价的内容可以概括为以下几个方面:n心理构建论。n价值协调论。n评价结果认同论。n应答性模式。n对学习资源与学习过程关注程度增大。第四代教育评价的主要方法 n档案袋评价 档案袋评价(portfolio assessment)是一种综合性的过程评价形式。随着当代信息技术的广泛应用,出现了各种丰富多彩的电子档案袋新形式,推动了档案袋评价的迅速发展。第四代教育评价的主要方法 n学习契约 学习契约(learning contract
14、)是学生与教师共同设计的一种契约,契约中界定了学生的学习目标、达成学习目标的方法、学习活动进行的时间以及评定学习活动的标准等。第四代教育评价的主要方法 n反思表评价 反思表(reflective form)是以问题或评价条目组成的表单,可以通过预先设计好的问题,使学习者了解到自己学习的完成情况,有效地启发学习者的反思,从而增强反思力和自主学习能力。第四代教育评价的主要方法 n表现评定 表现评定(performance assessment)就是通过学生所完成的综合性的、真实的任务来对学生进行评定,要求学生运用他们的知识和技能去完成综合的、有意义的任务。第四代教育评价的主要方法 n动态评定 动态评定(dynamic assessment)有两层含义,“一是跨越多个时间点观察评定学生的进步与改变情形,了解学生动态认知历程与认知能力变化的特点和潜能。二是评价者与被评价者之间产生大量的互动,强调评价与教学结合,实施个体化的诊断评价与教学补救。”一般我们运用更多的是第二种含义的动态评定。将评价融入学习环境的设计