梅含辛
长期以来,人们一提及教育评价,想到的就是标准化考试及其测量结果,这种以数字表征的结果所代表的客观性和科学性成为标准化考试得以服人的重要原因。因此,在综合素质评价实施之初,人们不自觉地去追求这一标准。而人是非常复杂、丰富的统一体。简单地以定量的方式很难对人的综合素质进行整体全面的评价,而且,量化的评价把复杂的教育现象僵化、简单化和表面化,往往失去了教育中最有意义、最根本的内容,无法反映真实的教育性。
所以,就需要定性评价的参与。这就涉及到一个问题:如何处理定性评价和定量评价的关系?本期,就“如何处理定性评价和定量评价的关系”进行讨论。
泰勒在《课程与教学的基本原理》一书中阐述课程评价的基本观点时指出,教育评价是判断课程和教学计划在多大程度上实现教育目标的过程,也就是判断学生行为模式发生了多大程度的改变。当然,这里的行为是广义的,既指看得见的行为,还指内在的思维、情绪过程;这里的变化也不仅仅是指短暂的变化,更是指一种深刻持久的变化,或者说是模式的变化。
评价的本质就是引出或阐发价值。课程中的学生评价是对学生学习和学力的评价,其根本目的是为学生的学习和发展提供有针对性的、切实的指导和建议。
一、教育评价是一种有限准确的手段
泰勒认为,教育评价是一种有限准确的手段。首先,实现教育目标的那一些经验(知识、能力和态度等等)虽然经过评估,不过,它们是与情境分离的、高度抽象的,只适用于一般性原则,而不是一种具体、复杂而又高度精确的陈述。其次,任何一组学习经验都包括很多标准,而其中每一种标准都只是近似的,因为我们只能在大体上或者以某种有限的准确性来预测这些学习经验是否会真的产生这样的效果。最后,学生个体的复杂性和学习情境的多样性,也是造成评价有限准确的外部原因。
2013年暑假,江苏省综合实践活动课程的省培活动中,笔者参加了一次《问卷调查设计指导》的课堂观摩活动。因为这一次观摩课由许多教师扮演学生来模拟课堂教学,要从教与学的双重角度去参与和评价,所以印象特别深刻。其中有一个环节是一项关于教师职业生活幸福指数的调查。针对执教者的这个问卷设计,有教师提出了质疑:“我对于问卷调查中关于幸福指数的量化指标的答案选项,始终无法接受ABcD或者类似的一种僵化分割。”
确实,对于人类情绪的强弱程度、感受能力的大小、思维的敏捷程度等抽象而又复杂的东西,调查问卷技术性的测试和评估表现了一种模糊准确的智慧。与此类似,教育评价是一种相对准确的判断。
定性评价多采用描述性的语言来决定评价对象水平的高低,所以相对来说全面、深入,不过客观性不强。定性评价更多的是关于对象的价值、性质和水平的描述。
定量评价以按照一定比例的数据为常模的量化技术,通过给出数值来展开评价,主要用数量表示评价标准、描述现象、分析状态、表示评价结果等等。虽然数值的形式比较单一,但在清楚明确的评价指标下,采取合理的评价技术,能够获得相对客观的结果。定量评价侧重体现了评价的区别功能。
基于人类行为的复杂性和评价情境的复杂性,所以在学生评价中需要通过定性评价和定量评价相结合的方式来突破评价的局限性,提高其准确度。
二、区分两种评价,发展促进学生学习和成长的评价
评价的本质不仅仅是区别,更是为了引出价值,而作为考试的评价强化了区别的手段功能,使得教育目的及其过程无形之中被异化了。
由于长期推行应试教育,中高考成绩已经成为评价学校教育的主要指标,这样导致了课程评价的单一和严重滞后,从而阻碍甚至误导学生的发展。这些已经成为我国新课程改革中亟待解决的突出问题。多尔在《后现代课程观》一书中指出,美国“在现代主义框架中,评价基本用于区别胜利者和失败者。这就是州和全国的考试,以及各类专业考试所做的——它们旨在区分等级”,“考试几乎普遍地作为区分手段而不是对话的起点”。
这里需要区分的是两种评价,一种是对学习的评价,也是作为选拔的评价;另外一种是为了促进学习(甚至是终身学习)的评价,而在教学之中更多应该采用这一种评价。让课程评价回归到推动学生个体智力和社会能力发展的教育本位和发展本位,这是课程评价改革的应有之义。
三、在清晰和细化的评价目标基础上,合理运用定量评价,既作为教育活动的反馈,又为学生的发展提供有价值的建议
泰勒认为,人类行为的评估是一个非常复杂而又系统的分析性过程,不應该是单一的分数总结。得知甲97分,乙64分,对于改进课程和帮助个体并没有太多的积极意义,而更加有用的是,在清晰和细化的评价目标下,表明优点和弱点的总结。根据学科关键能力、核心概念,采取多种目标的分类评价和分类评分,通过澄清打分细则来提高评价的客观性,这种表明了特定优点和缺点的分析性总结在改进课程、促进学生的自我调整方面是很有价值的。
反对应试,并非单纯反对考试,而是合理发挥定量评价的作用。多尔指出,“从本质上说,评价应该成为共同背景之中以转变为目的的协调过程。……应将其(评价)作为一种反馈,作为‘做——批——评——做——批——评这一循环过程的组成部分。这种个人做、公众批评的回归过程——是杜威批评性反思或科学方法的核心——是经验转变的关键。……现在的重点在于旨在帮助个体的社区,通过批评和对话发展个体的智力和社会能力”。
从立足社会的建构主义学习观出发,学习是个体围绕与自我、环境和他人的三重对话,而促进学习发展的评价同样体现了三重对话,有利于多重关系的建立。评价不是学习的终结,而是学习的新起点,其目的是推动反思,促进学生在学习中生成主动的意识。作为促进学习的评价,应该贯穿在整个活动过程中。
四、综合学习的表现性评价以真实和自主的定性评价,促进学生主动发展,建构意义
20世纪60年代初,美国盛行行为目标的概念,其实际用意是将所有指导性目标转化为能被观察的行为方式。内尔·诺丁斯在《当学校改革走入误区》一书指出,使用“标准”一词的用意是传递统一和高质量的概念,但是它导致了非常复杂的标准——关于内容的纷繁复杂的表格,由于太过繁琐,而无法适用于所有学生。诺丁斯批评说,过于强调这样的细化行为目标,会窄化学习,学科之间的联系也被忽视,使学习和成长变得无趣,等等。因为个体的性向(个人特征的综合,包括智力、能力和倾向性)是独特而又丰富的,而面对个体的教育及其评价也应该因境施评、因学施评和因材施评。
综合实践活动课程以促进学生养成健康人格、发展个性、培养学生的创新能力为核心目标,这门课程的最大优势正是课程内容的不确定性,因为其课程内容极其广泛,足以针对不同学生开展个性化的课程和评价。
综合实践活动课程更多采取表现性评价手段。表现性评价是指对真实情境中完成任务程度的价值判断,表现为多样化的实践活动,是真实情境之中具体实际的、非抽象的任务活动。活动的“真实性”保证了评价的真实性,使得学生在真实情境之中接触了更多的信息和困难,当然,因为其本身来自生活,所以更加容易激发学生挑战的动机。不过,要解决这样的综合问题和任务,往往需要综合深刻的理解力和多方面的能力。表现性评价往往运用定性评价,通过开发评价量规,采用描述表现、判断性质的定性评价手段达到评价的目的。
笔者了解到这样的案例:某个四星高中理科基地班有一名成绩比较优秀的女生,她在综合活动课程的《雷雨》话剧表演之后,毅然决定弃理从文。在这个案例中,综合课程通过活动丰富了学生的体验,而表现性评价通过评价引导学生自我反思,实现了积极的自我探索和自我决策。
需要指出的是,定量评价和定性评价处于课程评价的测量技术层面,与课程经营管理、课程评价文化等的其它侧面有着千丝万缕的联系。所谓牵一发而动全身,课程评价改革绝不是单纯技术或效率的问题,它牵涉到教育思想和哲学、课程模式和方法等的改造,因此不可能毕其功于一役。