黑匣子内:
通过课堂评价提高标准
——形成性评估是课堂工作的重要组成部分,可以提高学生的成绩
原文作者 保罗·布莱克和迪伦·威廉
保罗·布莱克是英国伦敦国王学院科学教育名誉教授。
迪伦·维利亚姆是英国伦敦大学教育研究所副所长。平
通过上学实现学习水平的提高是国家的一个重要优先事项。近年来,世界各国政府为了追求这一目标,都在积极进行变革。国家、州和地区标准;目标设置;强化学生表现的外部测试计划;诸如NAEP(国家教育进展评价)和TIMSS(第三次国际数学和科学研究)等调查;改善学校规划和管理的举措;更频繁、更彻底的检查等手段都是向着同一个目的。但是,所有这些改革加在一起并没有一个有效的政策,因为有一些缺少的东西。
学习是由教师和学生在课堂上相互互动驱使的。教师必须管理复杂而苛刻的情况,疏导30个或以上的青少年在个人、情感和社会压力方面的问题,帮助他们立刻进入学习,成为更好的学习者。只有教师能有效地处理这项任务,标准才能有所提高。上述努力所缺少的,是对这项任务的任何直接帮助。这一事实在TIMSS视频研究中得到了承认:'忽视课堂教学过程的标准和问责制不会为教师在寻求改进的过程中提供所需的方向'(斯蒂格勒和希伯特1997年)。
就制度而言,美国和许多其他国家目前的政策似乎把教室当作一个黑匣子。来自外部的某些投入——学生、教师、其他资源、管理规则和要求、父母的焦虑、标准、高风险的考试等等——都被输入到盒子里。一些产出应该遵循:学生更了解优势和能力,更好的测试结果,教师谁相当满意,等等。但是,在盒子里装什么?如果我们不能研究内部发生的情况,那么谁能确保一组特定的新输入会产生更好的产出呢?为何第一段提及的大多数改革措施并非旨在直接协助和支持教师在教室里的工作呢?
通常人们给出的答案是这取决于教师:他们必须让内部工作做得更好。这个答案不够好,原因有二。首先,至少对投入的一些改变可能会适得其反,使教师更难提高标准。其次,把最棘手的标准制定难题完全留给教师,似乎很奇怪,甚至不公平。如果这是政策制定者和其他人有办法
大量研究证据表明,课堂上日常的评估实践充满了问题和缺点。
直接帮助和支持日常课堂任务,实现更好的学习,那么,肯定应该积极大力推行
这篇文章是关于黑匣子的内部。我们专注于教学的一个方面:形成性评价。因此,我们将努力表明此功能是有效教学的核心。
论点
我们从一个不言而喻的命题开始:教与学必须是互动的。教师需要了解学生在学习方面的进步和困难,以便使他们能够调整自己的工作以满足学生的需要——这种需要往往是不可预测的,而且因学生而异。教师可以通过多种方式了解他们需要知道的内容,包括在课堂上的观察和讨论,以及阅读学生的书面作业。
我们使用一般学期评估来指所有由教师进行的活动——以及学生在评估自己时所进行的活动——这些活动提供的信息将被用作修改教学活动的反馈。当证据被实际用于使教学适应学生的需要时,这种评价就成为形成性评价。(这里没有国际公认的术语。“课堂评价”、“课堂教学”、“内部评价”、“教学教学”、“学生评价”等词汇被不同的作者使用过,其中一些词汇在不同的文本中有不同的含义。
这并不是什么新鲜事。所有的老师在他们教的每一节课上都做评估。但在这个过程中有三个重要的问题我们需要回答:。所有教士都在他们所教的每一个班级里做评估。但是,我们寻求回答三个重要问题:
1.是否有证据表明,改进形成性评估会提高标准?
2.是否有证据显示还有改进的余地?
3.是否有关于如何改进形成性评估的证据?
为了回答这些问题,我们对研究文献进行了广泛的调查。我们查阅了许多书籍和过去9年160多种期刊,并研究了早期的研究综述。这一过程产生了大约580篇文章或章节进行研究。我们准备了一份冗长的重新审视报告,使用了250份来自这些来源的材料,这些材料已经发表在《教育评估》杂志的一期特刊上,来自澳大利亚、瑞士、香港、莱索托和美国的主要教育专家对我们的工作提出了评论(布莱克和威廉 1998)。
从我们的重新搜索回顾中得出的结论是,以上三个问题的答案都是肯定的。在以下三个主要部分中,我们概述了证明这一结论的证据的性质和效力。但是,因为我们在这里要做一个总结,所以我们的文本在断言上显得很有力,而在论证的细节上显得很弱。我们坚持认为,这些主张是有证据支持的,并且这一支持在本文的长篇审查中详细阐述了。
我们认为,以下三部分有力地证明,政府、它们的机构、学校当局和教师职业应该非常认真地研究它们是否真正有兴趣提高教育标准。然而,我们也认识到广泛的证据表明,教育的根本变化只能通过在现有良好做法基础上实施专业发展计划来缓慢实现。因此,我们并不认为形成性教育是教育的另一种“灵丹妙药”。所涉及的问题过于复杂,与课堂实践的困难和推动公共政策的信念联系过于紧密。在最后一部分,我们面对这种复杂性,并试图制定一个战略行动的证据。
改进形成性评价能提高标准吗?
1986年发表的一篇研究综述主要集中于轻度残疾儿童的课堂评估工作,调查了大量的创新,从中选择了23项(Fuchs和Fuchs 1986)。那些被选择的人满足了这样一种条件,即对参与创新的人和不太参与创新的类似群体,都获得了学习收获的定量证据。从那以后,又有许多论文发表,描述了类似的细致定量实验。我们自己的综述选择了至少20个以上的研究。(这个数字取决于选择标准的严格程度。)所有这些研究都表明,包括加强形成性评价实践在内的创新会产生显著的、往往是实质性的学习收获。这些研究涵盖了从5岁到大学本科的各个年龄段,涉及多个学校的科目和多个国家。
为了研究的目的,这种类型的学习收获是通过比较参与创新的学生的测试分数的平均进步和在相同测试中发现的典型组的学生的分数范围来衡量的。前者除以后者的比率称为效应大小。形成性评价实验的典型效应值为0.4 ~ 0.7。这些效果比大多数教育干预的效果要大。下面的例子说明了这种巨大收益的一些实际后果。
0.4的效应值意味着,参与创新的学生的平均成绩与不参与创新的学生中排名前35%的学生相同。
在最近的国际数学比较研究(Beaton et al. 1996)中,如果效应值增加0.7,那么41个国家(如美国)中的一个国家的分数就会上升到前五名。
许多这样的研究得出了另一个重要的结论:改进的形成性评价比其他学生对低成就者的帮助更大,因此在提高整体成就的同时缩小了成就的范围。最近一个值得注意的例子是一项完全针对成绩差的学生和有学习障碍的学生的研究,该研究表明,频繁的评估反馈有助于两个群体提高他们的学习(Fuchs等,1997年)。这类学生的任何收获都可能特别重要。此外,那些认为自己不能学习的学生通常不再认真对待学校。许多成为破坏性的;其他人则选择逃学。这样的年轻人很可能被社会疏远,成为严重社会问题的根源和受害者。
因此,很明显,重要的学习成果就在我们的掌握之中。这些成果是通过各种方法获得的,而这些方法的一个共同特点是强化形成性评价,这一事实表明,这一特点至少在一定程度上说明了成功的原因。然而,这并不是说在普通的教室里大规模地取得这些成果是一件容易的事。我们研究的许多报告提出了许多其他问题。
所有这些工作都需要新的方法来加强被教者和老师之间的反馈,这些方法需要在课堂实践中做出重大改变。
在这些不同的学习方法背后,都有关于如何有效学习的假设——尤其是学生必须积极参与的假设。
我们所需要的是一种成功的文化,一种所有学生都能成功的信念。
为了使评估更形式化地发挥作用,评估结果必须用于调整教与学;因此,任何项目的一个重要方面都将是教师做出这些调整的方式。
评估影响学生动机和自尊的方式,以及让学生参与自我评估的益处,都值得我们认真关注。
还有改进的空间吗?
缺乏实践。大量的研究证据表明,日常的课堂评估实践存在许多问题和不足之处。
“评分通常是认真的,但往往不能提供如何改进工作的指导。在相当少数的情况下,分数会因为太过慷慨或不专注而导致成绩不佳和期望过低。教师收到的有关学生成绩的信息没有充分用于指导后续工作,”根据英国中等学校视察报告(OFSTED 1996: 40)。
一项针对加拿大中学教师(Dassa, Vazquez-Abad, and Ajar 1993)的研究报告称:“他们确实口头上支持(形成性评估),但认为在当前的教育背景下,这种做法是不现实的。”
美国学校评估实践的回顾(尼尔1997)指出:“上述评估实践并不常见,尽管这类方法现在在专业文献中得到了广泛推广。”
评估中最重要的困难围绕这三个问题。
第一个问题是有效的学习。
教师使用的考试鼓励死记硬背和机械的学习,即使教师说他们想要发展理解;许多教师似乎没有意识到这种不一致。
教师使用的问题和其他方法不会与同一所学校的其他教师共享,也不会根据他们实际评估的内容进行批判性的审查。
尤其对于小学教师,在学习过程中,有一种倾向是强调工作的数量和表现形式,而忽视其质量。
第二个问题是负面影响。
分数和评分功能被过分强调,而有用的建议和学习功能被低估。
学生之间相互比较的方法,在他们看来其主要目的是竞争而不是个人进步;因此,评估反馈让成绩差的学生认识到他们缺乏“能力”,导致他们认为自己无法学习。
对任何学生的反馈都应该是关于学生自己的特殊质量,以及关于他或她可以做些什么来提高的建议,并且应该避免与其他学生进行比较。
第三个问题是评估的管理作用。
教师对学生的反馈似乎具有社会和管理功能,但往往以牺牲学习功能为代价。
教师通常能够预测学生在外部考试中的成绩,因为他们自己的考试会模仿学生的成绩,但同时教师对学生的学习需求了解太少。
收集分数以填写记录比分析学生的作业以了解学习需要更受重视;此外,一些教师不注意他们的学生以前的老师的评估记录。
当然,并不是所有的描述都适用于所有的教室。事实上,有许多学校和教室根本不需要他们。尽管如此,通过观察、访谈和问卷收集证据的研究人员还是得出了这些普遍的结论
-来自包括美国在内的几个国家的学校
一个空的承诺。过去十年中,英格兰和威尔士国家评估政策的发展说明了在发展形成性评估政策支持方面存在的障碍。1988年政府工作队(1988年评估和测试工作队)的建议以及后来所有政府政策声明都强调了教师形成性评估的重要性。然而,负责执行政府评估政策的机构既没有战略来研究也没有战略来发展对教师的形成性评估,只是将其资源的极小部分用于这种工作(Daugherty 1995)。大多数现有资源和大多数公众和政治注意力都集中在国家外部试验上。虽然教师对这些“总结性评价”的贡献已被给予了一定的正式地位,但很少有人关注教师通过形成性评价所做出的贡献。此外,教师的形成性角色和终结性角色之间的关系问题也没有得到足够的重视。
有可能的是,许多承诺是在这样的信念中陈述的:形成性评价是没有问题的,它已经一直在发生,只需要正式承认它的存在。然而,同样明显的是,为了促进竞争而对外部测试的实际承诺是中心优先事项,而对形成性评估的承诺是长期的。正如世界各地的研究人员所发现的那样,高风险的外部测试总是主导着教学和评估。然而,它们给教师提供了形成性评价的较差模型,因为它们提供整体成绩总结的功能有限,而不是有用的诊断。考虑到这一事实,许多对英国教育改革实施情况的重新研究发现形成性评价“严重需要发展”就不足为奇了。(Russell, Qualter, and McGuigan 1995)。事后看来,我们可以看到,未能认识到对形成性评估提供实质性支持的必要性并承担起发展这种支持的责任是一个严重的错误。
在美国,人们从以不信任教师为特征的政治运动中也感受到了类似的压力,这些政治运动认为,外部测试本身就能改善学习。政策制定者和教师之间的这种断裂关系并非不可避免——事实上,许多教育成就可行的国家似乎都能很好地管理好政策,对教师表现出更大的尊重和支持。虽然美国的情况远比英格兰和威尔士多样化,但国家强制的高风险检测的效果与英国的外部检测非常相似。此外,美国对多项选择题考试的传统依赖——英国没有这种情况——加剧了此类政策对课堂学习质量的负面影响。
如何改进形成性评价?
小学生的自尊。小学生的自尊。一份关于瑞士学校的报告称,“一些学生hellip;hellip;满足于“得过且过”。“hellip;hellip;每一位想要实施形成性评价的教师都必须重新构建教学契约,以抵制学生们所要求的习惯。”(Perrenoud 1991)。
为了提高学习能力而引出的评估信息的最终使用者是学生。这一事实有消极的一面,也有积极的一面。前面的引用说明了它的消极方面。当课堂文化关注于奖励、“金星”、成绩或班级排名时,学生们就会寻找获得最好成绩的方法,而不是提高自己的学习。一个报道的结果是,当学生有选择的时候,他们会逃避困难的任务。他们也花时间和精力寻找“正确答案”的线索。事实上,很多人因为害怕失败而不愿意问问题。遇到困难的学生被引导去相信他们缺乏能力,而这种信念使他们把他们的困难归
剩余内容已隐藏,支付完成后下载完整资料
英语原文共 11 页,剩余内容已隐藏,支付完成后下载完整资料
资料编号:[272193],资料为PDF文档或Word文档,PDF文档可免费转换为Word
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。