石中英:回归教育本体——当前我国教育评价体系改革刍议

作者:发布时间:2020-09-30

2018 年 9 月 10 日,习近平总书记在全国教育大会上明确指出,“健全立德树人落实机制,扭转不科学的教育评价导向……要坚决克服唯分数、唯升学、唯文凭、唯论文、唯帽子的顽瘴痼疾,从根本上解决教育评价指挥棒问题,扭转教育功利化倾向”。这段重要论述一针见血地指出了长期以来我国各级各类教育评价中比较突出、深受诟病的“五唯”等问题,为推进我国教育评价制度改革指明了方向。2020 年 6 月 30 日,中央全面深化改革委员会第十四次会议审议通过了《深化新时代教育评价改革总体方案》,就如何贯彻落实全国教育大会精神、深化教育评价领域改革做了系统部署。为进一步帮助广大教育工作者深入理解习近平总书记重要讲话精神,贯彻落实好《深化新时代教育评价改革总体方案》,推进中国特色、世界水平教育评价体系建设,本文对我国教育评价体系存在的主要问题,产生这些问题的复杂原因进行分析,在此基础上,提出完善我国教育评价体系的若干建议,求教于教育界同仁。


我国教育评价体系存在的主要问题

当前,我国教育评价的基本制度体系,总体上反映了我国教育事业发展从外延式发展到内涵式发展、从教育大国向教育强国转变的阶段性特点,对改革开放以来我国教育事业发展起到了积极支持和引导作用。但是,随着教育在经济社会发展和人的发展中的地位和作用越来越重要,尤其是随着经济全球化、社会信息化、文化多样化和科学技术日新月异对国民素质和创新性人才培养提出新挑战新要求,现行的教育评价体系越来越不适应人自身的发展要求,与广大人民群众对优质公平教育的美好期盼不相符,与加快实现教育现代化、建设教育强国、实现中华民族伟大复兴的战略需求不一致,亟须对其加以改革。


(一)教育评价的法律依据薄弱
教育评价对于教育实践活动具有极强的导向作用,是影响教育实践活动的重要制度因素。开展教育评价活动,应当有充分的法律依据或授权,尤其是涉及广大师生切身利益的高利害教育评价活动,更应该有明确的法律依据或授权。但是,目前来看,我国教育评价的法律依据比较薄弱,缺少明晰的法律规定和足够的法律保障。《教育法》与教育评价有关的条款是第二十五条,规定“国家实行教育督导制度和学校及其他教育机构教育评估制度”。依据该条款,《义务教育法》第八条规定,“人民政府教育督导机构对义务教育工作执行法律法规情况、教育教学质量以及义务教育均衡发展状况等进行督导,督导报告向社会公布”。《高等教育法》第四十四条规定,“高等学校应当建立本学校办学水平、教育质量的评价制度,及时公开相关信息,接受社会监督。教育行政部门负责组织专家或者委托第三方专业机构对高等学校的办学水平、效益和教育质量进行评估。评估结果应当向社会公开。”从这些法律条文规定来看,现行教育法律体系对教育评价有了基本的法律规定,但并不明晰;对教育评价、教育评估、教育督导等的法律地位、性质和关系未做明确说明;对像中考、高考、研究生考试等涉及亿万学生切身利益的选拔性评价也没有明确的法律规定等。

(二)教育评价的管理体系有待完善
从上述教育评价法律规定来看,我国基础教育阶段的教育评价主要是政府教育督导部门的职责,高等教育的教育评价则分为内部评价和外部评价,内部评价主要是大学自身的责任,外部评价也属于教育行政部门的责任,被委托的专家或第三方专业机构在实行外部评价时,是接受教育行政部门的委托和指导,评价方案、评价结果由教育行政部门讨论通过、予以发布。这种评价管理体制有它的优点,能够保障评价目标与政府教育事业发展目标的一致性,保障教育评价的方向性。但是,实事求是地说,这种教育评价的管理体制也有明显的弊端:各级政府部门(政府教育督导机构、教育行政部门)既是教育主办者又是教育评价主体,容易导致教育评价的专业性、独立性和客观性受到影响。如果政府部门进一步将教育评价的结果与公共教育资源配置等实行“硬挂钩”,会给被评价对象造成极大的压力,极易出现政府或其委托的第三方机构怎么评,学校就怎么建,工作就怎么抓的局面。

(三)教育评价对教育多样性重视不够
多样性是教育系统的一个普遍特征。教育系统的多样性特征是教育系统适应内外不同环境的自然结果。就区域而言,中东西部的教育系统有很大的不同;就学校系统而言,有城市学校与农村学校,有普通学校与职业技术学校、特殊学校;就学生来源而言,有以本地学生为主的学校,有以外来打工子弟为主的学校;就学生的族裔身份而言,有以单一民族学生为主的学校,也有多民族学生共同学习的学校,彼此之间差别很大。就教师队伍构成而言,一所学校不同教师所从事的教学科目不同,研究领域不同,承担的岗位职责也不同。就学生群体而言,就更加多样,不仅有学业基础的不同,还有家庭经济和社会背景的不同,更有未来职业追求和人生理想的不同。对于这些教育系统不可忽视的多样性特征,教育评价从理念到标准的制定到数据的收集和评价结果的分析等,都应该予以认真回应。然而,现行教育评价制度中一个被广泛诟病的问题就是忽视评价对象的特殊性,在评价过程中存在比较严重的“标准化”、“一刀切”问题,导致了各级各类教育共同存在的同质化或趋同化现象,进而引发教育系统的“攀比风”、“升格风”。

(四)教育评价的数量繁多
教育评价的对象类型多样,大到对整个国家教育体系的评价,中到对某个地区教育系统的评价,小到对一所学校办学情况、一位教师教学情况以及一位学生的学习发展情况的评价。现在不管是哪一类评价的对象,都感觉到各种正式的、非正式的教育评价数量太多、频次太密。即使是同一项评价也在不断改革,花样翻新。在数量增多的同时,评价的类型和方式也日益多样。以高中生的综合素质评价为例。一些先行开展高考试点的省份建立了综合素质评价的申报系统,根据有关部门对综合素质评价内容的定义,要求高中生不断地在线提供综合素质学习活动、反馈或取得成绩的证明,不仅给高中生造成了极大的负担,也逐渐扭曲综合素质评价的初衷,导致综合实践活动本身的“应试化”。再以大学教师的教学评价为例,以前不重视教学评价,现在开始重视后则把教学行为的很多方面都纳入评价内容,从一般教学大纲、教材或学习材料到师生互动(留痕)、参加教学培训,到承担教改项目、获得从校级至国家级的各种教学成果奖等。在这种应接不暇的评价中,个体对学术和教学的真正兴趣、热忱与抱负渐渐弱化了,所在意的就是如何去熟悉新的评价规则,如何准备迎接新的评价以及如何在新的评价中过关或脱颖而出。

(五)教育评价中的实质性评价不足
教育评价中的实质性评价力图反映评价对象实质特征的评价理念和模式,倡导按照对象本身的特性来评价它,所有指标的制定都要反映对象本身的特性。从这个角度来观察,当前我国各级各类教育评价基本都是形式化评价,致力于对评价对象的外部特征进行描述、分析和判断,很少反映甚至违背评价对象自身的本质要求。比如,一所普通高中的核心任务是促进学生在道德、认知、情感、体质、审美以及人格方面的发展,但一些对普通高中教育的评价却完全忽视其核心任务,只看高等学校的升学率尤其是升入重点大学的比例,升学率对一所普通高中发挥了“一俊遮百丑”的功能。又比如,长期以来,一些高等学校在评价教师的学术水平时,不是考察他们学术成果的质量、创新和贡献,而是以在规定时间内发表论文的篇数、刊物级别以及获得的项目级别和经费多少来衡量,这也完全偏离了高等学校学术评价的实质特征。这些形式化的教育评价对整个教育体系产生了错误的导向作用,是造成各级各类学校工作教育性或学术性内涵不足的重要原因。

(六)教育评价结果的使用功利化突出
各种各样的教育评价为何会对教育系统和具体的教育行为产生这么大的影响?最直接原因就是教育评价结果的使用高度功利化。教育评价结果使用的高度功利化,是指教育评价结果直接与对评价对象的利益诉求(政绩、声誉、资源分配、职称晋升、获奖、学术权力、升学、就业等)挂钩,决定着评价对象获得可欲求利益的有无或大小,令人欲罢不能。以普通高中的重本率(也称一本率)、清(华)北(大)率和是否产生高考状元为例,虽然这些年国家教育行政部门明令禁止在高考之后炒作这些指标,但很多地方还是有禁不止。高考分数出来后、高等学校招生结束后,这些指标几乎立刻就为一个地区所有的高中学校校长知晓,地方行政部门对普通高中教育质量的奖惩随之而来。优质高中和高水平大学围绕着高分学生的竞争也越来越激烈,一些地区、一些学校甚至存在使用不当手段的现象。如此功利化的教育评价结果的使用世界罕见。再以大学排名为例,它不仅指向高等学校自身利益,还将其他利益群体如学生、家长、政府等纳入行为框架,构建起社会公众共同认可的行为意义系统。“尽管排名的拥护者极力为其辩护,但是,事实上排名已经产生了明显的消极影响:助长大学急功近利,助长忽视学生和教学的倾向,助长淡化办学特色,助长大学盲目扩张,助长不道德竞争,助长西方文化中心。”

(七)教育评价中存在值得重视的伦理问题

教育评价中的伦理问题是影响教育评价行为及其结果公正性、公信力和可接受性的关键问题。它主要表现为评价过程中评价者和被评价者一方或双方在信息保密、数据呈现和收集、评价判断、结果使用等方面对诚信、客观、中立、平等、公正等评价伦理规则的疏离甚至违背。多年来各种教育元评价的研究表明,评价伦理问题广泛存在于从宏观的教育评价到中观的教育评价直至微观的教育评价之中。比如,学术界广泛抨击的“圈子文化”,其主要问题在于评价者与被评价者之间的人际关系因素在评价过程中时常发挥干扰作用,以至于影响各种学术评价本身的公正性、公信力和可接受性。作为普通高中和高等学校招生录取重要参考的综合素质评价之所以迟迟不能推进,也是由于教育界内外对综合素质评价材料、过程和结果的公正性抱有高度疑问,担心在综合素质评价的各个环节中发生违背评价伦理的事情。如何让各级各类教育评价,尤其是那些事关师生切身利益的教育评价始终在法律、规则和道德的阳光下进行,这是构建科学教育评价体系必须要认真思考和解决的重大问题。


我国教育评价体系存在问题的主要成因

教育评价是对教育实践的价值定义和价值赋值,既是一种科学的认识活动,也是一种价值的评价活动,应是合规律性与合价值性的统一。因此,教育评价中存在问题的成因非常复杂,既受人们认识能力的制约,也受人们所处价值立场、所持价值标准以及所憧憬的价值理想的影响。厘清不同类型教育评价中存在问题的原因,需坚持具体问题具体分析的原则。总体上说,当前我国教育评价体系存在问题的主要成因有以下方面。

(一)对不科学教育评价体系危害的认识不足
教育评价中存在的“五唯”等问题成为“顽瘴痼疾”,长期得不到解决,甚至有愈演愈烈之势,这与教育系统内外对其危害性认识不足、不到位有直接关系。比如,关于基础教育中“唯分数”、“唯升学”的问题,自 20 世纪90 年代以来就广为人知。这种问题迟迟得不到解决,一方面说明问题本身的复杂性,不仅有教育系统内部的原因,也有教育系统外部的原因;另一方面也说明政府部门、社会公众、广大教育工作者和家长对于其危害还仅仅停留在表面的、局部的认识上,还没有到痛心疾首、深恶痛绝的程度,还没有深刻认识到这种评价的价值导向对学生健康、和谐和可持续发展的巨大危害,没有深刻认识到“分数主义”、“升学主义”对国民素质以及建立在国民素质基础上的社会政治、经济和文化生活等各方面所造成的严重威胁,更没有深刻认识到这种评价的价值导向对培养能够担当民族复兴大任的时代新人、应对百年未有之大变局、实现中华民族伟大复兴的历史性后果。在这种认识条件下,想要有效解决“唯分数”、“唯升学”的问题,是不可能的。

(二)对人的本质、教育的本质和教育发展规律的认识不足
教育评价的对象无非是教育系统和教育系统中的人——教师与学生。对教育系统的评价,应该反映教育的本质特点与教育实践活动的规律性认识,对教育系统中教师和学生的评价也应该反映人的本质,反映教师劳动的特点和学生学习与成长的特点。否则,教育评价就不是实质性的评价,而成为一种形式化的评价。形式化的评价只能反映教育系统或教育活动中的师生的外部特征、条件性特征或可通过量化表征的特征。一旦教育评价追求对教育系统或师生的这种外部特征、条件性特征或可通过量化表征的定义、评定、比较、排名,教育评价就会遗忘真正的教育、学校、教师或学生,出现教育评价中既没有“教育”也不见“人”的悖论。正如有学者所说,“在本体论意义上,人不可按照物化的方式被对待,人的心智、心灵品质无法被数据估算,人的生命价值不应当被估算。数据化教育测评体现为一种强制机制,它不仅以数据标注、预测、预定、区隔学生,也激化了教育的竞争与焦虑,加剧了教育的功利化和工具化。教育测评看起来是为了实现教育目标,促进教育效率,实际上它是附加在教育实践之上的非教育装置,与真正的教育及其过程相异,与存在性学习对立。教育测评的大数据化具有教育隐忧。”例如,在某些学科评估中,将教学质量作为评估的内容是合理的,但在各种教学质量的评估指标设计中,几乎完全忽视了来自教师和学生的质性评价,只是将国家或省级名师数、教材数、教学项目数、教学获奖、国家精品课程等可量化的数据作为教学质量的证明,完全脱离了教学本质特性。在相当程度上,对人的本质、教育的本质以及各级各类教育规律的忽视、认识不够和错误认识,是导致当前我国教育评价诸多问题的一个深刻思想根源。

(三)我国现代教育治理体系本身尚不完善
当前,我国教育评价主体众多,各评价主体开发的教育评价项目数量纷繁复杂,彼此之间又缺少价值方向上的一致性和具体评价工作中的协调性,以至于一线的校长和教师自嘲说:“一年到头,不是在接受评价,就是在准备接受评价。”这种现象极大地干扰了教育系统的运行和各级各类学校的正常教育教学秩序。产生这种问题的根源之一就是我国的现代教育治理体系还不够完善,主要表现在教育评价的法律规定还不够明确、具体,谁能评价,谁不能评价,评价什么,不评价什么,评价主体、评价对象各有什么样的权利、责任、义务等都不够清晰;各级各类教育标准研究和建设滞后,缺乏明确的、前后衔接、彼此贯通的教育标准体系;教育评价的价值性、专业性、独立性和客观性没有上升到法律规范的层次,导致社会上各种教育评价泛滥且免于承担起码的评价责任;教育评价中数据来源的可靠性与合法性、评价结果的发布和使用也缺乏必要的法律约束、行政监督和问责机制等。伴随着这种现代教育治理体系不完善的,是现代教育治理能力不够。具体到教育评价治理而言,一些教育系统的决策者、管理者和广大一线校长教师,对于教育评价的认识与理解非常有限,即使一些专门从事教育评价或质量监测的机构从业者,对于教育评价的理解也还仅仅停留在“教育测试”、“问卷调查”的水平,认为教育评价就是给教师和学生出题或者给管理人员发问卷。这种状况与现代教育评价治理所需要的高度专业性要求完全不能匹配。

(四)受新自由主义、新管理主义及绩效主义的影响
就目前我国教育评价体系而言,其背后的理论假设总体上还不清晰,有待于进一步加以澄清。可以辨识的是,20 世纪 80 年代以来,在西方教育改革乃至经济社会事业改革中居于主导地位的新自由主义(Neo-liberalism)和新 管理主义(New Managerialism)在其中起到了不可忽视的作用,它们潜移默化地支配着决策者、管理者和教育者的评价思想与管理行为。新自由主义和新管理主义在教育评价上的合流就形成了著名的“绩效主义”(Performancism)。“绩效主义源于对企业经营管理的反思,是指以绩效为核心,以层层分解指标任务为重点,以精细化的量化考核为杠杆,以经济奖励和惩罚为基本手段的企业管理体系。”正是在这种绩效主义的指导下,各种教育评价在实践中非常强调任务分解、指标达成、可量化数据、效率评估、责任追究、结果排名等,其结果不仅助长了教育评价中工具理性的泛滥,而且还引发了教师间、学科间、学校间、区域间的无序教育竞争,严重削弱了教育系统的内部团结和教育事业本身的公共性和伦理性。一些学校对教师绩效的考核点、考核等级的划分细化到极致。这种将教师一切劳动直接与工作量、金钱报酬挂钩,试图把教师的工作态度、热情、能力、投入、效果等统统量化并进行积分排序的做法,其实质是对教师工作性质的企业化、矮化和庸俗化,最终会败坏师德师风,使得教师遗忘自己的教育初心,成为追名逐利之徒。身处这样一个被人们称作“绩效型社会”(Performativity Society)或“审计型社会”(Audit Society)的时代,我们必须深刻反思这种绩效主义及其背后的理论假设给教育生活和教育秩序带来的严峻挑战与危害。

(五)反映了我国教育评价理论与技术的贫困
教育评价实践中的诸多问题,也反映了当前我国教育评价理论与技术上的贫困。历史地看,我国的教育评价古已有之。《礼记·学记》中就记述了西周时期学校评价的内容和标准:“比年入学,中年考校。一年视离经辨志,三年视敬业乐群,五年视博习亲师,七年视论学取友,谓之小成。九年知类通达,强立而不反,谓之大成。”这背后反映了儒家以德性养成、内圣外王为核心的人生观、价值观和教育观,其目标表述在今天也具有借鉴的意义。隋唐之后,我国通过分科考试的方式来选拔人才,考试的内容和评价的标准也有明确的规定,侧重考查考生的经学知识、文化素养、思辨能力、价值视野以及社会抱负等。进入现代社会以来,我国的教育评价理论则主要是从国外输入。中华人民共和国成立之前对我们影响较大的是教育测量运动。中华人民共和国成立之后对我们影响比较大的则是苏联的以知识掌握和智力发展为核心的评价理论与方法。改革开放之后,西方尤其是英美国家的各种教育评价理论被介绍进来,像泰 勒(Tyler,R. W.)的评价理论、布鲁姆(Bloom,B.)的教育目标分类学、克拉斯沃尔(Krathwohl,D. R.) 的 行 为 目 标 评 价(behavioral-objective evaluation)以及美国20世纪 80 年代后提出的第四代教育评价等。这些评价理论及其相关技术对于我国改革开放以来的教育评价实践——从中高考到各种宏观的教育评价实践——均产生了多方面的影响。进入 21 世纪之后,各种国际性教育成就评价的理论和方法如国际学生评估项目(Programme for International Student Assessment,PISA、第三次国际数学和科学研究项目(Third International Mathematics and Science Study,TIMSS)对我国的教育评价实产生深刻的影响。回顾历史,审视现实,我国本土的教育评价理论研究与技术创新不足是客观事实。以中高考中高利害的综合素质评价为例,虽然国家相关政策文件中已经就综合素质的内涵做了规定,但关于综合素质是什么、与学生发展核心素养有什么关系,综合素质评价评什么、谁来评,综合素质的指标如何制定、结果如何解读等问题,需要进一步从学理上厘清。正如有学者所说:“纵观综合素质评价中存在的一系列问题,尤其是综合素质评价的内涵界定、指标划分、指标赋权等一系列问题,都需要在理论层面上进行分析和澄清,因此需要教育理论工作者对综合素质评价进行学理研究,澄清综合素质评价的诸多理论问题,服务决策层面的顶层设计。”

(六)受传统文化中消极因素的影响
我国目前教育评价中存在种种“顽瘴痼疾”,既有评价者和被评价者认识上以及我国现代教育治理体系不完善等主客观的原因,也深层次地反映我国传统文化中一些消极因素的影响。顾明远先生强调指出,像中国传统文化和教育中“学而优则仕”、“重学术轻技术”、“重伦理轻技术”、“讲名分重等级”、“重整体轻个体”以及由此衍生出来的“攀比文化”、“面子文化”、“出人头地”(做“人上人”)思想等对于我国教育实践包括教育评价存在长期和复杂影响。他认为,历史上“学而优则仕”、“学而优则禄”等思想产生了学历主义的价值观,也就是我们今天所说的“唯学历”问题。“重学术轻技术”(也可以称为“重道轻术”)导致了职业教育在整个教育体系中的地位不高。“攀比文化”则广泛存在于学生评价、教师评价、学科评价、大学评价等评价实践中,也是导致各种评价中被评价者过度焦虑甚至行为失范的重要因素。注重社会关系和人情的“面子文化”也常常会影响教育评价过程的公正性。“重整体轻个体”的思想一方面使儒家优秀的“因材施教”思想得不到落实,个性发展在教育中没能得到足够的重视;另一方面也影响到教育评价行为,助长了评价过程中的“标准化”和“一刀切”现象。至于“讲名分重等级”的文化传统则与现代社会平等的价值格格不入,但却广泛渗透到教育生活的方方面面。各种各样的教育排名之所以能够大行其道,也是利用了这种古已有之的“讲名分重等级”的文化和心理陋习。


深化教育评价体系改革的若干建议

 党的十八大以来,政府和教育界对各级各类教育评价问题的严峻性有着高度共识,并着眼于构建科学的教育评价体系,陆续出台了一些具体的教育评价改革政策,及时矫正教育评价中一些不良价值导向,努力推动教育评价体系的改革。《深化新时代教育评价改革总体方案》的制定,在构建中国特色、世界水平教育评价体系的历史进程中迈出了更加坚定的步伐。为进一步做好有关工作,笔者基于上面的分析,提出如下建议。

(一)以马克思主义和习近平总书记关于教育的重要论述为指导
从马克思主义的基本立场、观点和方法来看,教育评价作为一种评价活动,它的本质不是技术性的,而是社会性的,在一些涉及党的教育方针贯彻落实以及办学方向的评价上甚至带有鲜明的政治性。因此,那些引起教育界内外严重不满的教育评价问题首先不是技术问题,而是价值问题。因此,要解决这样的教育评价问题,仅从技术上改进、在评价指标的数量上做加减法是不够的,必须把树立正确的教育价值观放在首要的位置,明确培养什么人、怎样培养人、为谁培养人这样的教育根本问题;必须坚持立德树人的根本标准,把办好人民群众满意的教育,满足人民群众对公平而又有质量教育的需求放在首位,引导教育评价问题上的各种价值思潮;必须坚持马克思主义的唯物辩证法思想,反对在教育评价问题上的各种二元对立,如个人本位—社会本位、内部评价—外部评价、定性评价—定量评价、工具理性—价值理性、手段价值—目的价值、形成性评价—终结性评价、个体性评价—团队性评价、统一性—多样性、“唯”—“不唯”、发表—出局(publish-perish),等等,做好各种价值取向的平衡和综合的工作,努力达成新的教育评价中的价值共识。

深化新时代教育评价改革,必须贯彻落实习近平总书记关于教育的重要论述。党的十八大以来,习近平总书记关于教育的重要论述集中体现在教育工作“九个坚持”的论述上,系统回答了“办什么样的教育”、“如何办教育”以及“为谁办教育”等涉及教育事业发展的根本性问题,这是指导新时代中国特色社会主义教育事业健康发展的思想纲领,也是指导新时代我国教育评价制度改革发展的根本理念。要坚持党对教育评价改革工作的全面领导,在教育评价实践和改革过程中全面贯彻落实党的教育方针,同时也把是否贯彻执行党的教育方针作为宏观教育评价的首要内容,把科学的教育评价体系的建立作为贯彻执行党的教育方针的重要机制。要坚持把立德树人作为教育评价的根本任务,确立立德树人在教育评价中的核心地位和检验教育工作成效的根本标准,不断改善立德树人的条件,提高立德树人的效益和质量,培养德智体美劳全面发展的社会主义建设者和接班人。要坚持把构建科学的教育评价体系作为优先发展教育事业的重中之重,为教育事业优先发展提供制度保障。要坚持教育评价的社会主义方向,体现社会主义教育事业的根本性质、发展规律和价值追求,确保教育评价改革始终沿着正确的政治方向前进。要坚持扎根中国大地开展教育评价改革,发挥好我国教育评价改革的体制和制度优势,充分汲取中国古代教育评价的优秀思想和经验,积极借鉴国际上教育评价的先进理念和有益做法,坚定教育评价改革的文化自信。要坚持以人民为中心深化教育评价改革,引导教育系统积极回应人民群众的教育关切,把提高广大人民群众对教育事业的满意度和获得感作为教育评价改革的基本价值遵循。要坚持把教育评价改革作为全面深化教育改革的重中之重,充分认识到教育评价改革在全面深化教育改革中的先导性和引领性作用,努力突破教育改革中的评价“瓶颈”,通过教育评价改革释放教育系统活力。要坚持把培养堪当民族复兴大任的时代新人、服务中华民族伟大复兴,作为教育评价改革的终极价值使命,充分认识推动教育评价改革的重大时代价值和深远历史意义。要坚持教师是教育工作的主体,也是教育评价改革的主体,在教育评价改革中充分问计于教师,充分发挥广大教师的积极性、主动性、创造性,把是否增加广大教师的获得感和专业活力作为评价教育评价改革是否取得成功的核心标准。

(二)各级各类教育评价必须回归教育本体
当前,学者们对各种各样教育评价问题的批评逐渐集中在批评现行教育评价所使用的指标偏离了评价对象本身,不能反映评价对象的根本特性上。例如,把分数当成学习者的发展,把升学率当成学校教育的质量证明,把论文发表的数量和期刊当成论文本身的学术贡献和创新水平,把学者的头衔当成学者自身,把拥有有头衔的教师人数的多少当成高水平师资队伍的标志,如此等等。概而言之,现行的这些教育评价正在走向“本末倒置”甚至是“舍本逐末”的危险境地。有学者曾指出,“在学术评价中,为体现客观性,简单的论文计数不敷所用,于是就有了引用次数,进而刊物影响因子与各种分区、基本科学指标数据库(Essential Science Indicator,ESI)引用排名等,计数模型越来越精致化。然而模型再精致化,数据再丰富,如果数据的内涵不能反映学术的内在品质,这种评价就难以做到完全客观。”现行的学术评价一味地追求数量上的客观性和模型上的精致性(各种指标权重确定的科学性),但其结果却偏离了或牺牲了“学术的内在品质”。而这种学术评价制度正是造成当前学术界虚假繁荣甚至产生学术不端的直接根源。还有学者也关注到这种评价现象在教育领域的广泛存在,认为“我们的学者、大学、政府普遍热衷于评价,却很少思考、更没有很好地把价值目标置于评价的中心。这样的评价只能是空洞的数字,没有意义的话语,不但不能提升、促进和引导教育的发展,反而把教育本质的追求、内涵的发展削弱和冲淡了”。显然,这样的教育评价已经不再是从评价对象的立场出发,更不反映评价对象本身的性质,反过来通过评价行为在评价者和评价对象之间形成了一种控制和被控制的关系,对评价对象构成了一种宰制性的力量。

如何解决这个带有根本性的教育评价问题?从教育哲学的层面上说,就是教育评价必须要回到“教育本体”,或者更通俗一点,回到“教育本身”。基于马克思主义的本体论立场,教育本体可以被看成一种培养人的社会实践活动,专门指向人的多样、可持续和有价值发展,与社会政治、经济、文化等其他类型的实践活动具有本质的区别。在此意义上,评价教育活动与评价政治活动、经济活动、文化活动也必须有本质的区别。这就需要进一步对教育本质属性进行分析。应当说,教育的属性是比较丰富的,但是其最根本、最普遍的属性还是立德树人,体现为教育的人文性和伦理性。但是,具体到“立什么德”、“树什么人”的问题,又有社会性和时代性,反映了一个时期社会政治、经济、文化、科技等方面的特殊要求。所以,教育的本质既包括一般本质,也包括特殊本质。教育的一般本质寓于特殊本质当中,并通过特殊本质表现出来。教育的特殊本质是一般本质在具体社会历史条件下的生动和丰富表达。这是教育本质的辩证法,也是教育评价回归教育本体必须予以考虑的具体内容。更明确地说,教育评价回归教育本体,最关键的就是要回归教育的本质,既要回到教育的一般本质,也要回到教育的特殊本质,既要体现教育的人文性、伦理性,又要体现教育的社会性、历史性。

以上是对教育评价要回归教育本体的简要理论分析。具体到各级各类教育评价、学校评价、校长评价、教师评价、学生评价都可以应用这个“回归教育本体”的思想方法,建立合适的概念框架和指标体系。如果就高等教育系统中的大学而言,大学的评价就应该体现大学的本质特点。大学的本质特点是什么?我国现在普遍的看法是教学、科研与社会服务的统一(即教育性、学术性与服务性的三位一体,是对传统教育性与学术性相统一的新发展),统一在“立德树人”这个核心任务上,具体指向德智体美劳社会主义建设者和接班人的培养。如果没有了立德树人这个核心,教学、科研、社会服务可能就会成为“三张皮”,出现科研与育人脱节、社会服务与育人脱节,甚至出现科研职能、社会服务职能压倒了育人职能的现象,“立德树人”本身被边缘化、虚化和口号化。现在各种各样的大学排行榜、学科排行榜之所以饱受诟病,根本原因就在于它们并不能充分反映大学的本质,只是对大学所拥有的各种条件、资源、荣誉、学术成就的评价,而不是对大学立德树人成效的评价。大学的学术评价也存在类似的问题。学术活动的本质是对未知世界的探索,目的是创造新的概念、理论、技术或方法。因此,学术评价最重要的是要看学术的创新性如何,而不是看发表论文的数量、发表刊物的级别、论文发表的语言以及论文发表的作者是谁。后面这些东西只是指引评价者接近学术本质的线索,而不是学术评价的应然对象。用学术活动的一些可量化特征来代替学术活动的本质特征加以评价,很容易误导研究人员远离学术活动的本质要求而追逐可量化的学术表现。

教育评价回到教育本体,在实际工作中要求评价者从评价对象的本质特性出发来制定评价标准、选择评价的工具和手段。评价的目的是为了评价对象能够更充分地实现自己的本质属性或者能够更好地履行自己的工作职责,而不是为了满足外部的排序、分等、控制等目的。教育评价要分类进行的主张可以从本体论上得到解释和辩护。评价对象的类型不同,采用同一种评价标准自然是不合适的,引导不同类型的高等学校或不同岗位职责或不同学科的教师都追求同一种标准更是危险的。同时,要加强学术和教育共同体的建设。教育是一项专业性的实践活动,高等教育必须以高深的学术性知识为媒介,因此,教育的评价最合适的主体就是教育者、学者自身,他们对教育的性质、内涵、价值、对象、结果以及学术的本质、多样性、前沿性、创新性等有着比其他人更为准确的认识,由此回归教育本体的教育评价必须依赖于负责任的教育共同体、学术共同体的忠诚履职和出色工作。加强各种各样的教育和学术共同体建设应该是教育评价回归教育本体的一项重要机制建设。

(三)进一步完善教育评价治理体系
当前,我国整个教育治理的体系还不够完善,尤其是教育评价治理体系尚未很好地建立起来。完善科学的教育评价治理体系,是深化当前我国教育评价改革的重要主题。

第一,审查和修订《教育法》、《高等教育法》、《义务教育法》、《教师法》等法律的相关条款,明确各级各类教育评价的相关法律规定,就各级各类教育评价的性质、主体、内容、类型、结果使用等基本问题作出适当的法律规定,并依据相应的法律规定出台具有指导性、规范性和约束性的部门规章制度,使我国整个教育评价工作有法可依、有章可循,进一步规范教育评价行为。

第二,审查和理顺教育评价的领导体制,就教育评价的多头管理、各自为政问题以及彼此之间的一致性协调性问题给出明确的解决办法。考虑我国教育领导体制的特点和国际上的教育评价治理的有关情况,建议构建部省两级教育评价领导体制;在教育部和各省市自治区教育行政架构下设立专门的教育标准和评价管理部门;组建专门的全国性和省级教育标准制定和评价专家委员会,这些委员会的专家构成应当体现多学科性,教育学家、心理学家、管理学家、著名大中小学校长等都应该有一定的比例;明确专家委员所承担的工作职责,构建全国和地方性教育标准体系和教育评价工作体系。

第三,调研大中小学的年度接受评价的类型、主体、内容、时间等,依照中共中央办公厅国务院办公厅《关于减轻中小学教师负担进一步营造教育教学良好环境的若干意见》,进一步做好统筹规范督查检查评比考核等事项,最大限度地减少对大中小学校和幼儿园的评价事项,同时督促大中小学和幼儿园清理学校内部对教师的评价事项,有效解决长期以来反响强烈的各种问题;坚决治理教育评价中的乱象,对那些没有授权、没有资质的市场化商业化教育评价行为,坚决予以取缔,为大中小学的教育教学营造良好的制度环境,将广大教师从过多、过滥、过频的教育评价中解放出来。

第四,加强教育评价的治理能力建设,将教育系统的决策者、管理者和广大一线校长教师教育评价素养和能力的提升纳入整个国家教育治理能力建设的计划,通过各种途径帮助他们建立科学的教育评价理念、树立正确的教育评价价值导向、善于正确运用教育评价的“指挥棒”引导教育事业健康发展。

(四)加强教育评价学科建设,推动教育评价理论与技术创新
目前而言,我国教育评价理论研究、实证研究、政策研究以及技术开发研究的总体水平有待提高,教育评价学科的科学研究、人才培养、社会服务、国际交流与合作等方面的能力也还有待进一步提升。首先,从学科布局来看,目前国内设置教育评价学科或教育测量与评价学科的高等学校数量屈指可数,主要集中在几所全国重点师范大学和极少数的省级重点师范大学等,远远不能满足各级各类教育评价工作的需要,应当有计划有组织地予以扩充。其次,从教育评价学科的学科基础来看,目前学科基础还比较窄,应当对于教育评价学科的多学科性、跨学科性予以充分体现,尤其是要加强教育评价学科基本理论的研究,加大构建中国特色、世界水平的教育评价体系重大理论问题研究。再次,从人才培养规模来看,每年该专业的硕士毕业生、博士毕业生数量非常有限,远远不能满足教育评价工作的需要。在各级各类教育行政部门从事教育标准制定、管理和教育评价管理的人员、大中小学幼儿园的校长也需要接受教育评价方面的专题学习和培训。建议在扩大教育评价学科授权点的同时,增加教育评价专业研究生的招生数量,同时开展在各级各类教育培训中增设教育评价的专题培训。最后,对大数据技术在教育评价中的应用进行专题评估,一方面,充分挖掘大数据技术促进教育评价改革的潜能;另一方面,将大数据技术与正确的教育评价价值取向、科学的教育评价体系有机结合在一起,避免大数据技术在教育评价中的错误应用,尤其要克服大数据技术助长对学生学习和教师教育教学工作的全过程控制,杜绝基于大数据技术所收集的有关教师、学生和学校的有关数据的商业化和不安全使用,加强对基于大数据开展教育评价的伦理审查。

(五)为建立科学的教育评价体系创造更加良好的社会支持体系
构建科学的教育评价体系,不能就教育评价论教育评价,必须着眼于社会改革发展和国家现代化建设的大局,做好顶层设计和统筹兼顾,重点解决那些直接影响科学的教育评价体系建构和完善的社会和文化制约因素,构建科学的教育评价的社会和文化支持系统。

第一,认真研究社会各行业尤其是重点岗位招聘中的学历歧视问题,真正做到在人才招聘时全面考察、择优录取、选贤与能,促进就业公平,为教育系统内部的评价改革创造良好的社会条件。在教育系统内部的人才招聘和高等教育本科、硕士和博士生招生中,也要明确反对“以帽取人”,反对第一学历歧视,坚持唯才是举。

第二,花大气力开展教育评价的舆论治理。深化教育评价体制改革,建立科学的教育评价体系,不能忽视媒体的力量和舆论的治理。要围绕党和国家有关教育评价改革的主要精神,发挥专家学者的作用,正确解读和积极宣传教育评价的新理念、新政策、新措施以及对人才培养及教育改革创新的长期效应。要治理新闻媒体中各种胡乱排名的现象,基础教育阶段中小学校和幼儿园应严禁排名,大学的各种排名也要严格限制,对于各种国际排名也要积极加强治理。要继续严格控制对中高考状元的宣传报道,严格控制对普通高中毕业生升入“清华北大率”、“一本率”等情况的宣传报道。应严格控制对各个大学拥有院士、长江学者、百千万人才、杰出青年等各种人才称号的公开报道,在日常的教育教学、项目申请、论文发表、学术报告、社会服务等各项活动中,应注重学者教学和科研的实际水平和贡献,明确规范人才称号的使用目的、范围和方式。

第三,充分发挥教育评价学术共同体的作用。当前,中国高等教育学会、中国教育学会等一级学会下都设有教育评价专业委员会,负责各级各类教育评价问题的研究、学术交流和人员培训工作,这是非常值得依赖的学术共同体。这些教育评价领域的专门学会应进一步明确深化教育评价改革的极端重要性,明确本学会所承担的重大责任,加强学会的组织建设工作,切实在教育评价改革领域发挥专业领导和支撑作用;围绕党和国家提出的重大教育评价问题深入教育一线,开展专题调查研究,厘清这些问题的具体表现、形成原因并提出可行性的政策建议,充分发挥教育评价学术共同体咨政建言的智库作用;专门学会相互间加强联系和协作,为整体推进教育评价改革贡献力量,同时加强与国外和国际教育评价协会间的交流与合作,在借鉴学习别国和国际上教育评价的先进理念和经验的同时,在国际上进一步讲好教育评价的中国故事,分享教育评价的中国经验,提供教育评价改革的中国案例,提高我们在国际上教育评价领域的影响力和话语权。

总之,构建科学的教育评价体系是当前中国乃至世界面临的一个教育难题,也是当前我国深化教育体制机制改革的一项重要任务。《深化新时代教育评价改革总体方案》的即将出台,标志着我国新时代教育评价制度改革已经从局部的改革进入总体改革的新阶段。希望本文对当前我国教育评价主要问题的描述、分析以及提出的建议能够有助于教育界同仁更好地把握深化教育评价改革的正确方向,进一步增强深化教育评价改革的紧迫感和责任感,深刻理解教育评价改革的长期性和艰巨性,并结合各级各类教育评价的具体情况,为构建和完善中国特色、世界水平的教育评价新体系做出新的努力和贡献。


文章来源:《教育研究》2020年第9期