一、问题的提出
随着当今世界人才竞争的日趋激烈,教育改革和发展越来越受到世界各国政府的重视。虽然各国教育改革与发展的背景、原因、动力各有不同,但教育的基本功能始终体现在两个方面:一是促进人的发展;二是促进社会的发展(潘懋元,1988)。教育促进人和社会的发展主要通过教育的两类产出发挥功能:教育直接(内部)产出是平等的受教育机会和一定质量的教育干预,能使受教育者个人在接受教育后增长知识和能力,养成品行和价值观念,促进个人的发展;教育间接(外部)产出则是指由于知识、能力的增长及良好的品行、价值观等内部产出,使受教育者在劳动力市场和社会活动中获得更高的收入和地位,促进经济增长和社会发展(王善迈,1996)。从教育基本功能的角度来看,更好的教育体现在更公平地保障受教育机会、更显著地提高教育质量、更有效地促进经济增长和社会发展以及带来更多的教育获得感。
提供更好的教育一直是各国政府深化教育改革的主要内容。长期以来,政府教育投入不足一直被认为是教育不够好的主要原因,于是各国政府纷纷立法加大对教育的投入,并制定优先政策扶持弱势学生或拥有不同学生群体的学校。但几十年来发达国家的实践并未证明更多的教育投入一定能带来更好的教育,教育机会和质量以及教育对经济社会的贡献并未同步提高。Cole Man等(1966)发现美国教育机会不均等对不同种族学生的影响是不同的,显著影响学生学业水平的因素不是生均教育经费,教育财政投入并未产生人们所预期的巨大效应。
政策制定者、社区、家长开始认为以上问题的出现更多来自于公共教育的官僚系统,必须依靠市场竞争和结构改革来加以解决。从20世纪80年代开始,大量的曾被证明适用于企业绩效改善的激励手段被迁移到了公共教育上。人们不仅从教育系统内分析教育投入与教育机会、学业成就的关系,还更多从组织学和管理学的角度出发,强调如何保证教育服务对公众和投资者负责,评价标准慢慢转变成目标达成度、教育对社会经济的贡献以及满意度。一些发达国家建立了教育绩效评价体系,根据自身的实际情况以及目标导向设计出本国的指标体系和评价方法,用以指导政府教育投入更好地发挥效用。
长期以来,我们形成了一种思维定势:我国“穷国办大教育”的基本国情注定了教育投入的不足(杨东平,2006)。为此,我国1993年提出了国家财政性教育经费支出占国内生产总值4%的投入目标,但直到2012年才正式实现。所以,这些年来我国教育理论和实践界一直更加关注教育投入的数量和规模,极少关注教育的产出和绩效问题。随着我国新时代社会主要矛盾的变化,“期盼更好的教育”成为我们推进各项教育改革的出发点和落脚点。《国家中长期教育改革和发展规划纲要(2010-2020年)》虽然提出“要建立经费使用绩效评价制度”,但目前在我国更多的政府教育投入能否带来更好的教育这一问题并没有得到明确的回答,从保障机制角度如何实现更好的教育,如何“更好地满足人民需求”,亟待进行相应的探讨。提高教育经费使用效益,是全面贯彻落实党的十九大精神、优先发展教育事业的必然要求,是加快教育现代化、建设教育强国的迫切需要,是推进教育公平、办好人民满意教育的重要举措。
本文在厘清“更好的教育”概念后,根据绩效原理,深入探讨教育投入和教育产出的关系,借鉴相关研究和政策要求,设计出教育投入和教育产出的指标体系,应用北京市16个区县2007-2013年初中数据,使用主成分分析法和DEA法,比较相关结论,为政府教育投入如何带来更好的教育提出相关的建议。
二、文献综述与研究假设
教育投入和直接产出关系的研究是典型的经济学效率研究;教育投入和间接产出关系的研究主要围绕人力资本促进经济增长方面展开,即教育收益率的研究。教育投入和直接、间接产出同时联系进行的研究则是绩效评价。仅研究教育投入与直接产出,就教育谈教育,忽略了教育是社会系统的一部分,教育最终是为社会经济发展提供人才;仅研究教育投入与间接产出,忽略了教育系统内部的发展规律。绩效评价的研究内容则更加全面和完整,既包含了教育本身的投入产出关系,又分析了教育的各种外部影响。
(一)教育投入与直接产出
教育投入和直接产出的研究主要涉及教育投入与教育公平以及教育投入与教育质量的主题。一般研究都发现教育投入对低收入家庭学生获得平等受教育机会影响显著,但与教育质量关系的结论则并不统一。Jackson等(2016)发现,生均经费对于来自于低收入家庭的孩子更有显著正向作用,因为它能降低家庭背景的影响。袁诚等(2013)对中国九个省份的城市住户调查数据分析后发现教育财政投入能降低家庭背景对学生学业成绩的影响。陈纯槿、郅庭瑾(2017)发现生均公用经费的提高显著降低了家庭经济收入对学生学业成就的影响,从而起到降低教育结果不平等的作用。HanusHek(1989)对美国教育生产函数研究总结中指出:教育投入与学生成绩之间不存在显著的系统性关联。胡咏梅和杜育红(2009)对我国西部五省区农村小学教育生产函数的研究也得出相同的结论。大量研究发现我国不同地区的生均教育经费虽然有显著差别,但对教育质量的影响大相径庭。有些研究认为东部发达省市义务教育财政支出效益较好,投入多,质量高(李晓琴、曹键,2017;肖建华,2012;杨斌、温涛,2009),但另一些研究结论恰恰相反,认为西部地区投入虽然少,但不存在东部地区过度投入存在的拥挤问题,反而质量更好(李玲等,2014;郭俞宏、薛海平,2011;白雪洁、房伟,2010)。极少数的研究探讨了区域内教育投入和教育质量的关系,也发现教育投入不一定和质量正向相关,如熊筱燕等(2010)利用江苏省市级数据,发现经济好、投入多的苏南地区,义务教育的升学率、巩固率和规模效益不佳;苏北地区投入少,但效率高。
(二)教育投入与间接产出
教育投入的外部影响,尤其是与经济增长关系的研究起步较早。早在上世纪60年代初,ScHultz(1961)就发现教育能够推动美国战后农业生产的增长,进而提出人力资本理论。Blankenau和SiMpson(2004)基于23个发达国家和57个发展中国家面板数据的研究认为,教育支出对发达国家的经济增长具有稳健的促进作用,但对发展中国家的经济增长却没有显著影响。郭华桥(2011)发现我国财政教育投资的GDP弹性系数近年已经呈现逐年下降的趋势。从地区层面研究我国教育投入与经济发展之间关系的经验研究也很多,例如,在利用我国省级面板数据的研究中,于凌云(2008)基于误差修正模型分析了教育投入与经济增长之间的关系。刘晔和黄承键(2009)利用固定效应模型,分析了不同区域教育经费对GDP增长贡献率的差异,发现教育间接产出弹性呈现出由东到西递减的过程。陈斌开等(2010)发现城市偏向的教育经费投入政策是城乡教育水平、城乡收入差距扩大的重要决定因素。钟无涯(2014)进行了京沪粤的区域比较,发现北京教育投入对经济增长绩效统计不显著,上海、广东教育投入与经济增长均存在双向Granger因果关系,而广东教育投入对经济增长具有持续显著的高正向激励。杨娟和赵心慧(2018)基于流动人口动态监测数据所做的经验研究发现,不同户籍流动人口在教育投入以及所拥有的教育资源方面的差异是导致城乡收入差距的重要原因。另外,也有少数学者基于我国个别省份和地区的数据进行了研究,例如崔晓迪(2013)基于天津数据进行统计分析,探讨了天津市教育投入与区域经济协调发展的问题。
(三)教育投入和两类产出
结合教育投入和两类产出的教育绩效评价实证研究较少,大多仍停留在从公共财政绩效评价理论出发,在概念形态上构建绩效评价指标体系。如OECD(1994)把绩效指标定义为“用以测量某一难以定量之物的数值”。为了对教育机构的活动和性质做出权威性的测量,绩效指标体系最好为“序数性”或“基数性”(Cave and Hunney,1992)。曾有国内学者认为政府教育支出绩效指标可从直接和间接两个方面分类(廖楚晖、唐里亚,2003),也可根据教育生产活动的过程(投入、过程、产出、成果)选择逻辑分析法开发义务教育支出绩效评价指标体系(成刚、袁佩琦,2007)。对国内文献仔细查询后,我们发现把教育投入与教育直接和间接产出结合进行的实证研究仅有一篇,杨丽丽和朱卫东(2014)根据安徽省地级市数据,进行了安徽省教育投入的绩效评价,把教育产出用在校学生数指标代表,教育效果则主要考察教育投入的经济效益,用财政教育支出对GDP的弹性系数表示,研究发现安徽省教育支出效率存在规模递减的情况且各市效率得分具有明显的差别。
教育投入和两类产出的绩效评价实证研究相对较少,主要原因可能在于:第一,虽然十九大报告等政策文本反复强调绩效评价的重要性,但教育领域传统的重投入轻产出的意识已深入人心,且由于绩效评价设计十分复杂,绩效评价在我国开展的时间较短,公众和政府的绩效意识比较薄弱;第二,西方国家开展绩效评价时往往依据绩效评价法律和制度,例如美国、英国、新西兰等国家的绩效评价大多以法律、规章、制度等形式固定下来,以解决绩效评价过程中存在的随意性、不确定性等因素。我国的法律建设中与绩效评价相关的却很少,与教育绩效评价相关的更少,且立法的层次也不高,仅有《财政支出绩效评价管理暂行办法》、《教育督导条例》等文件;第三,绩效评价是一项比较复杂的工程,需要完整以及准确的信息系统,依赖于政府部门的统计数据,但目前教育绩效评价所需的数据分布在不同的部门,并无统一的信息来源,如教育投入相关数据,由教育行政管理单位的财务部门掌握,学生数、巩固率、升学率等产出数据由教育行政管理单位的规划部门统计,教育满意度等信息则由教育督导部门负责采集,各自独立,数据整合难度较大;最后,教育投入与产出关系常用的生产函数难以分析多种教育投入和多种教育产出的关系,教育投入和更好的教育之间并非简单的线性关系,很多产出及影响难以全面量化,计量上存在较大的难度。
(四)研究假设
通过以上对于相关文献的分析,可以发现教育投入并不一定带来更好的教育产出。教育投入和教育产出之间实现较高的效益受到多种因素的影响,既有投入要素的数量、质量和结构,也有要素使用过程的组织、管理和制度(王善迈,1996)。此外,公办教育系统从来不是成本最小化的领域,既没有动力也没有压力来促使绩效最大化(杨秀芹,2009)。因此,本文提出第一条待检验的假设。
研究假设一:更多的教育投入不能带来更好的教育。
教育投入一般包括人力、财力和物力。这三类资源的配置结构随着教育类型、学科专业、教育发展阶段、教育规模、工资水平、教育技术条件等变化而变化。如高等教育对物质技术条件要求较高;而理工科相对于人文社会科学来说也需要更多的物质资本投资(陈晓宇,2012)。汉纳谢克和雷蒙德通过对美国国家教育进步评估项目(NAEP)调查数据进行分析,发现教育财政投入要起到作用,其关键之处就在于对各类公共教育资源进行公平、科学配置。北京作为我国的首都,虽然一直高度重视教育投入,但人财物的投入结构并不一定适宜。在北京编制和户口等吸引力下,人力资源投入的数量和质量并不是问题。北京市普通教育事业公用经费定额标准早在1989年就已制定,并在此之后根据实际情况进行了不断调整,已成为全国生均经费最高的省份。相比较而言,办学条件可能需要格外重视。线联平(2012)就曾发现2010年北京市义务教育的办学条件的差距最大。为此,我们提出第二条假设。
研究假设二:教育投入结构的物力资源更影响教育绩效
正如文献综述所强调的,教育的产出是多方面、综合性的,但这些产出之间如何平衡并无相关论述。现实中甚至会出现不同产出之间的矛盾,必须要进一步明确更好的教育需要哪类教育产出。目前很多实践中的绩效评价多侧重于技术、工程和资金使用的合规性方面的检查,未充分反映出教育本身的特征,重经济增长指标,轻社会发展指标(成刚、徐文俊,2017)。
习近平总书记指出,基础教育在国民教育体系中处于基础性、先导性地位。基础教育的作用更为长期和隐形,对经济社会发展的影响相对间接,应特别关注人民群众在教育事业中的切身利益变化,是否促进了社会公共效益以及社会福利的最大化。因此,相应提出第三条研究假设。
研究假设三:教育产出的社会效益大于经济效益
三、研究设计
(一)指标体系
本文指标体系的设计基于合规性、可行性和科学性三个原则,结合义务教育管理的实际需要,初步设计出了一套对区县一级进行评价的教育投入产出指标体系。
区县教育绩效评价指标分为三级:一级指标有3项,即教育投入、教育直接产出、教育间接产出,从整体评价指标设计架构上看,突出教育两类产出的评价;二级指标有8项,即教育经费、办学条件、师资队伍、教育普及和公平、素质教育、社会效益、经济效益、教育对象满意度等;三级指标共有17项,绝大部分都是客观的可量化的指标,少数为主观的定性指标,既有常规统计可获得的信息,也有只能通过专项调查才能分析的数据。权重将通过客观的统计方法获得。
本文实证研究部分使用了表1(表略)中的9项投入指标,基于数据的可获得性,产出指标则最终选择了“教育普及和公平”中的“学生数”、“巩固率”以及“社会效益”中的“学校平均服务半径”和“经济效益”中的“教育经费弹性系数”4个指标。其中,初中巩固率指的是初中入学人数与毕业人数的百分比,能较好地了解义务教育普及的质量和效果。根据《城市普通中小学校舍建设标准》(建标[2002]102号)的说明,学校的合理布点应具有较好的社会效益,体现在学校服务半径要适宜。教育经费弹性系数是教育经费增长率与国民生产总值增长率的比值,该指标说明教育经费增长的相对变化与其所带来产出的相对变化的关系,即以弹性系数表示的教育经费支出效益。
(二)测评方法
对教育投入和产出进行绩效评价,需要选择合适的评价方法。同类评价在选择方法的过程中,有两项准则:其一,评价方法能够体现投入与产出在数量、质量、价值等方面的统一关系;其二,评价方法有助于将多产出多投入比的问题,转化为单产出(函数)和单投入(函数)比,进而得到绩效值。为此,本研究选择主成分分析法计算出综合投入、综合产出和绩效得分,并用DEA方法对绩效结果进行检验,加强结论的稳健性。
主成分分析方法可以对指标进行降维,找出少数几个综合因子来代表原来众多指标变量,利用这些综合因子尽可能多的反应原来指标变量包含的信息。本文各指标KMO检验值均大于0.7,①Bartlett球形检验的显著性水平P<0.001,说明各变量之间的相关性显著,适合用主成分分析法。数据包络分析的方法(DEA)原理主要是以相对效率概念为基础,借助数学规划方法确定相对有效的生产前沿面,从而评价相对有效性。
四、样本及描述统计
郡县治,天下安。在以区县为主的义务教育管理体制背景下,同一区域内的比较才更有政策意义和现实价值。北京是新中国教育的高地,也是全国教育改革和发展的风向标,1993年以来,北京市在普及义务教育的基础上,开始关注并采取相应政策措施解决非均衡问题(赖俊明,2011)。但北京各区县在区位、经济、人口、环境等方面存在较大的差异,情况复杂且多元,和全国一样存在着义务教育发展不平衡不充分的问题,因此我们认为选取北京各区县为案例具有一定的参考和推广价值。本文使用的是北京市16个区县2007-2013年的普通初中投入和产出数据,教育投入类数据来自于历年《全国教育经费执行情况统计公告》和《北京统计年鉴》,教育产出类数据来自于历年《北京区域统计年鉴》和专项调查。以货币度量的变量均以2007年为基期进行了物价调整。从表2(表略)可以看出样本年份典型区县普通初中的投入和产出基本状况。
样本年份典型区县初中生师比为7.94:1,高于规定学历专任教师比例为4.3%,中级及以上专业技术职务教师比例为48.86%,反映出北京市各区县多年来初中教师的总量充裕、质量较高。样本年份典型区县初中生均公共财政预算内教育事业费平均为18667.80元,此指标为全国同期最高。样本年份典型区县生均公共财政预算内公用经费平均为5448.96元,公用经费占教育事业费的比例约为29.19%,基本符合国际上的经验标准。样本年份典型区县生均校舍面积为17.19平方米/生,高于规定标准。样本年份典型区县生均教育固定资产值平均为26988.68元,生均专用设备值平均为5310.64元,生均图书册数平均为49.80。区县和年份之间生均专用设备值差距最大。
样本年份典型区县普通初中学生数为19280人,学生数呈现先上升后下降再持续上升的变化状态,但各区县和年份之间学生数差别较大。从样本年份典型区县来看,普通初中的巩固率保持得较好,但波动较大,最小值为73%,最高值为148%。
样本年份典型区县初中服务人口为3.48万/所,略低于规定标准,说明教育资源未得到充分利用。并且区县和年份之间,服务半径差距较大。样本年份典型区县的经费弹性系数为2.43,教育经费支出的经济效益较好。
五、实证结果
由于分指标难以进行综合评价,之后的实证将使用主成分分析法和DEA方法进行多投入多产出分析。实证结果表明:
(一)人财物各种投入中,办学条件影响最大
1.办学条件是各种教育投入中的决定性因素
本部分利用主成分分析法,对9个教育投入指标进行综合分析。总方差解释结果见表3。从表中可以看出,特征值大于1的主成分有3个,其方差累积贡献率已经达到72.41%,此指标一般在70%至90%即可(刘丝雨,2013),只要选择前3个主成分,其所代表的信息量已经能够比较充分地解释并提供原始数据所能表达的信息。并且,前三个特征根比较大,第四个特征根下降较快,为了综合评价的方便,只取前三个公共因子较为适宜。这三个因子在9个指标上的荷载情况如表4所示(表略)。
从表4因子载荷矩阵可以看出:因子F1与X7(生均固定资产总值)、X8(生均专用设备值)、X9(生均图书数)相关性强;因子F2与X3(专任教师中中级及以上专业技术职务教师比例)、X6(生均校舍面积)相关性强;因子F3与X1(生师比)、X2(专任教师中高于规定学历教师比例)相关度较高。第一主成分F1占有最大的权重(其λ最大),表明第一主成分所代表的办学条件是各类教育投入中的决定性因素,研究假设二得到证明。北京市义务教育应着重教学环境和教育设施设备的投入和维护的原因可能在于,当时除北京市中小学办学条件达标任务外,抗震加固改造校舍工程对今后的校舍维修提出更高要求。此外,随着首都教育体系要求提供更加丰富的高质量教育,素质教育进一步落实,学生综合素质显著提升,初中课程改革增加了课程的开放性和选择性,而且还增加了新的学科和领域,开设了大量全新的选修课程,需要更丰富的仪器设备、实验材料和图书资料。胡咏梅、杜育红(2009)和梁文艳、杜育红(2009)也发现物力资源投入变量对学生学业成绩有显著影响,尤其是拥有图书量具有成本低、效果好的作用。
2.城市功能拓展区综合投入力度最大,生态涵养发展区排名最低
根据旋转前的因子载荷矩阵,我们得出综合因子模型为:
F1=0.1211X1+0.0261X2+0.0355X3+0.3205X4+0.0903X5+0.0339X6+0.4766X7+0.4615X8+0.3790X9
F2=0.1853X1-0.0728X2+0.6763X3+0.4385X4+0.3988X5+0.6577X6+0.0599X7+0.0162X8+0.2435X9
F3=0.7581X1+0.7903X2+0.0557X3+0.2228X4+0.2115X5-0.1253X6+0.0775X7+0.0035X8+0.2864X9
根据表2前3个公共因子对模型的方差贡献率,构造出北京市各区县初中教育投入综合得分模型:
F=(0.40766^F1+0.16973^F2+0.14672^F3)/0.7241
其中,F代表各区县初中教育投入的综合得分;^Fi代表公共因子Fi(i=1,2,3)的得分。
将统计数据代入上述3个等式,就可以计算出各区县在3个公共因子方面的得分和排名;再将这3个公共因子的得分代入F中,可以计算出各区县各年度投入指标综合得分,并可得到2007-2013年投入综合得分的年度平均值。
从图1(图略)中可以看出,城市功能拓展区与首都核心功能区的初中综合投入力度最大,尤其是海淀区和朝阳区,生态涵养发展区的得分最低,密云县排名垫底。相关研究发现地区间公共教育投入差距较大的原因,主要受到地区间经济发展水平、产业结构,尤其是居民生活水平等因素的影响(成刚,2011)。以人均GDP、第三产业比例和城镇居民收入为例,2007-2013年这三个指标的区域排名均是首都功能核心区最高,城市功能拓展区其次,生态涵养区最低,排名前四位的区一直都是东城区、西城区、朝阳区和海淀区这四个区,只不过不同指标四个区的排名略有不同。如人均GDP,排名前几位的区一直是西城区、东城区、海淀区和朝阳区;第三产业比例的排序则变成东城区、西城区、朝阳区和海淀区;城镇人均收入排名依次为海淀、西城、东城和朝阳。
(二)教育的各种产出中,学校服务半径和学生数的影响最大
1.教育直接产出的学位提供和间接产出的社会效益是教育产出中的因素
本部分利用主成分分析法对初中教育4项产出指标进行分析,以特征值大于1提取主成分,共2个主成分,累计方差贡献率为75.335%,由此可知提取两个主成分即可代替原有4项产出指标所包涵的75.335%的信息。
提取的主成分是具有综合意义的综合性指标,各个变量的载荷系数越大表示其对该主成分的解释性越强。运算得到两个主成分。第一种主成分主要反映了初中的社会效益和普及程度,学校平均服务半径和在读学生人数因子载荷最高;第二种主成分反映了教育的经济效益,初中教育经费弹性系数越大,说明教育经费与社会经济发展越发紧密。第一主成分F1占有最大的权重(其λ最大),表明第一主成分所代表的教育直接产出的学位提供数和间接产出的社会效益是教育产出中的决定性因素,研究假设二得到证明。初中属于义务教育,教授的是基础知识、基本技能、基本方法和基本态度等,是对公民素质的最基本要求,与适应就业和促进经济发展所需要的技能不同,经济效益相对不明显。北京市各区县普通初中的产出更多体现在更多的教育机会和学校平均服务半径,可能原因在于北京市自2005年开始进行专项的初中建设工程。当时北京“小升初”择校过热,老百姓对初中学校办学水平不均衡非常不满意,初中被北京市相关管理部门认定为义务教育均衡发展最为突出的薄弱环节(罗洁,2009)。为此,北京市调整教育经费支出结构,加大对初中教育的投入。各区县根据本地区实际,每年确定一定数额的专项资金用于初中建设。制定全市初中学校的布局调整规划,通过强弱联合、资源整合、对口支援等手段,扩大初中优质教育资源供给,对办学困难学校进行调整和改造。
2.城市功能拓展区教育产出效果最佳,海淀区排名最高,生态涵养发展区教育产出综合分数最低
根据旋转前的因子载荷矩阵,得出产出综合因子模型:
F1=0.5457Y1-0.5080Y2+0.6663Y3-0.008Y4
F2=0.4585Y1+0.4437Y2-0.0365Y3+0.7691Y4再按照上表中的前2个公共因子对模型的方差贡献率,可构造出北京市各区县初中教育产出综合得分模型:
F=(0.42314^F1+0.3302^F2)/0.75335其中,F代表各区县初中教育产出的综合得分;^Fi代表公共因子Fi(i=1,2)的得分。
最后将统计数据代入各项等式,最终计算出各区县各年度产出指标综合得分,并可得到2007-2013年产出综合得分的年度平均值。
从图2中(图略)可以看出,城市功能拓展区教育产出效果最好,其中海淀区初中阶段教育产出综合得分排序第一,首都核心功能区与城市发展新区排序位于中游水平,生态涵养发展区初中阶段的教育产出持续低迷,延庆县排名最低。可以认为,教育产出的各项指标主要受到各地区的人口分布和自然条件影响。
城市功能拓展区的学生数最多,类型最丰富。2007-2013年城市功能拓展区的初中学生数年均为31136人,占同期北京市初中学生数的38%,并且区域内有城市学校、城乡接合部学校,有纯农村学校,还有大学附属学校以及民办学校等多种类型的学校。本区域农村和城区并存,面积较大,初中平均服务半径达到了5.43公里,是所有区域中服务范围最大的地区。海淀区和朝阳区是这个区域最典型的代表。同时,此区经济社会较为发达,增长较快,产业结构合理,教育经费的弹性系数较大。首都核心功能区人口集中,面积狭小,年均初中平均服务半径仅为2.67公里。生态涵养发展区多为山区、农村,人口资源薄弱,严重影响了教育的产出效果。
(三)更多的教育投入未必能带来更多的教育产出
我们继续运用投入-产出分析方法构建绩效指标,测算出2007年-2013年北京市16个区县七年整体初中阶段教育资源配置使用绩效得分排序。图3直观地把各区县初中教育资源的绩效进行了4等级评定,区域之间的综合评价结果显著不同,海淀区、丰台区和朝阳区的初中绩效得分排名前三,全部位于城市功能拓展区,而排名最低的三个区县门头沟区、延庆县和怀柔区全部位于生态涵养区。
投入高的区域产出不一定高。如东城的投入排名第3,但产出排名则为第8。投入低的区域产出也可能高,如大兴投入仅排第10,但产出能排在第5。绩效的高低与投入-产出的高低不是完全对应的,产出高的区域,其资源利用绩效也不一定高,因为仅仅可能投入较多,资源的使用过程和组织并不一定有效,如西城的产出排名第4,但绩效排名则只有第8。正如研究假设一提出的,教育投入和教育产出之间实现较高的效益受到多种因素的影响,如规模是否适宜、质量是否适当、结构是否合理、资源是否共享等。不同区域的教育资源承载力影响着这些不同因素,适宜的教育资源承载力其本质就是合理的教育发展方式,就是教育的可持续、内涵发展(丁学森、邬志辉,2016)。
核心城区东城、西城的最终绩效排名都不高,可能与教育承载力不足有关,本区域属于典型的老城区,小规模学校多,虽然教育投入质量高,教育经费充裕,但受地理空间限制,建设用地资源紧张,新建、改扩建学校增加学位困难。此外,办学条件中的校舍建筑面积、体育场地、图书馆和实验室等都受到巨大的影响。规模小的学校数量多,各自独立办学,也难以充分共享资源。功能拓展区和城市发展新区绩效较高可能在这两个区域是北京市经济增长和城市发展最快速的区域,面积较大,城市化程度较高,人口大量涌入,能新建规模较大的学校,并充分地综合利用区域内的图书信息和教室等资源。生态涵养发展区教育承载力过剩,与人口外散、跨区上学等现象有关。易成栋等(2014)根据第五次和第六次全国人口普查的数据研究发现,北京市人户分离占总常住人口的比重从2000年的35.1%增加到2010年53.5%。大量的优质教育资源仍集中在城区内,导致了北京市的跨区县择校(袁连生、何婷婷,2018)。生态涵养发展区作为教育资源薄弱区域,现有的教育资源也并没有得到充分利用。例如,2009年北京市审计局通过绩效审计就发现北京市农村义务教育存在部分资金、资产闲置、使用效率不高的现象。
(四)基于DEA方法的绩效结果检验
为了加强绩效评价结果的稳健性,本部分采用DEA中的BCC模型对北京市各区县初中的绩效进行比较。BCC模型解除了对规模报酬的约束,是在规模绩效变化的情况下讨论技术效率是否最佳的问题。结果和主成分分析的发现一致:城市功能拓展区效率最高,生态涵养发展区最低。海淀区、丰台区教育资源配置使用绩效最高,门头沟区、延庆县教育绩效最低。
本文还对两种方法计算出的效率值和排序进行了检验,主成分效率值和DEA效率值之间的相关系数为0.60,线性相关的显著性系数为0.01,说明两种方法计算出来的效率值之间显著正相关。另外,对区县的主成分效率排序和DEA效率排序的SpearMan系数为0.57,显著性系数为0.02,可认为这两种方法排序也存在一致性。
六、结论与讨论
本文从深入剖析教育的基本功能入手,在区分教育的直接产出和间接产出的基础上所进行的经验研究表明:第一,教育投入多的区域并不一定能有更好的教育,优质教育资源聚集的地区由于承载力不足,带来学校规模小、效益低等问题,农村或偏远地区由于人口分散、空间距离远,导致承载力过剩,教育供给成本高,且浪费严重。义务教育学校“城市挤、乡村弱”这一现象在我国很多地区普遍存在,目前我国已进入上中等收入国家行列,并进入城镇化快速发展的黄金时期。义务教育作为公共产品,是吸引人口流动的重要力量之一,具有“洼地效应”。如果某区域义务教育质量高,就会吸引更多适龄儿童随迁入学,进而挑战该区域的教育资源承载力;如果义务教育质量低,也会影响产业劳动力的供给。人口向某些区域的不断集聚也将引发农村过疏化和城市过密化的人口分布格局,进而对原有的义务教育学校布局形成严峻的挑战,近年来大班额等现象的出现就是无序发展的恶果。其他地区应该借鉴《北京城市总体规划(2016年-2035年)》的做法,严格限制城市规模,必须匹配性地限制基于住宅数量、城市可居住户数量的城市居住人口(包括进城务工人员)数量与基于学校数量、学位数量的在校学生(包括随迁子女)数量,只有这样才能提供公平有质量的教育。应积极落实十九大提出的乡村振兴战略和区域协调发展,加快农村人口城镇化进程,完善促进人口转移机制,加强生态文明建设。此外,要贯彻落实十九大关于“全面实施绩效管理”的要求,强调“花钱必问效、无效必问责”,将绩效管理覆盖所有财政教育资金,建立健全体现教育行业特点的全过程绩效管理体系。坚持厉行勤俭节约办教育,严禁超标准豪华建设。
第二,从教育投入的结构来看,要想获得“更好的教育”,办学条件的影响最大,这也反映出新时代我国义务教育发展进入到新阶段。1993年我国出台《中华人民共和国教师法》后,对教师资格和任用有了明确的法律规定,教职工编制标准和工资标准愈加科学和规范,加之近年来我国高等教育的迅速发展,培养出的合格教师迅速增加,师资保障程度较好。自2005年我国农村义务教育经费保障新机制实施以来,国家明确规定了义务教育学校生均公用经费基准定额。《中华人民共和国义务教育法》又再次强调省、自治区、直辖市人民政府可以根据本行政区域的实际情况,制定不低于国家标准的学校学生人均公用经费标准。人财物的投入结构中,办学条件近年来成为发展的短板。国家出台了《农村普通中小学校建设标准》和《学校课桌椅功能尺寸》等相应标准,多个省市也出台了义务教育学校办学基本标准或义务教育学校标准化建设通知,但这些办学条件标准“一刀切”,比较僵化。此外,标准执行弹性太大,优质学校达标困难。如相关规定考虑到历史和土地资源的实际情况,往往强调这些办学条件的建设指标只适用于新建中小学校,改建、扩建中小学校一般参照执行,但优质学校往往集中在核心城区或市区,办学历史较长,几乎很难达到统一的办学条件标准。根据我国首份《义务教育质量监测报告》,中小学的教学资源使用率也不高。监测数据显示,在拥有图书馆的学校中,一半的初二学生在监测的学期中没去过图书馆。在配备了科学实验室的学校中,39.7%的初二物理教师表示从不或很少使用。为此应加快研究制定小规模学校办学条件标准,因地制宜,全面加强乡村小规模学校和乡镇寄宿制学校建设,保证小规模学校的基本办学条件,切实加强可移动的和对教育质量贡献度大的资源配置,保证必要教育教学活动的全面开展。还要提高教师使用教学资源的技能,并加强日常运行维护,及时补充消耗性材料。
第三,教育的产出是多方面、综合性的,现实中甚至会出现不同产出之间的矛盾,因此必须清晰判断“更好的教育”需要哪类教育产出。研究发现,要想获得“更好的教育”,与教育产出的经济效益相比,社会效益更为重要——这主要表现在学校的服务半径和所提供的学位数方面。由于低龄儿童的特殊性,义务教育规定就近入学,就近入学凸显出学校服务半径和学位数的重要性。虽然两基达标解决了人人有学上的问题,但随着人民群众对更好教育需求的日益增长,教育发展不平衡不充分日益明显,如何让老百姓就近公平地享受优质教育资源取决于合理的划片,而合理的划片有赖学校的服务半径和学校提供学位的能力。
当然,本文作为义务教育绩效评价的探索性研究,还有很多不足之处,比如未使用学生成绩或体质健康等产出指标。绩效评价高度依赖数据的准确和充分,但我们在研究中发现教育产出和效果的数据极度缺乏和分散,理论或原则上应该使用的指标因为缺乏数据支撑,难以进行评价,专项调查的数据持续性不够且不够公开,很难进行持续性地跟踪和使用,这一问题值得关注和分析。
来源:《北京师范大学学报(社会科学版)》2019年第2期