基于教育改进的教育监测评价的现实反思与路径优化

基于教育改进的教育监测评价的现实反思与路径优化
2024年11月26日 16:31 潜水探秘者

本刊刊载之全部论文,从不收取任何版面费、审稿费、编辑费,如有言称收费者,必为假冒。

欢迎投稿

官方网站:www.jcse.com.cn

作者信息

檀慧玲/北京师范大学中国基础教育质量监测协同创新中心副教授、博士生导师;

张涵/北京师范大学中国基础教育质量监测协同创新中心硕士研究生。

本文摘要

“为了改进”是教育监测评价的基本价值定位。实现从重“鉴定识别”到重“赋能改进”的转变是教育评价改革中一个迫切需要重点关注的问题域。当前我国教育监测评价已经形成较为成熟的运行机制和关键要素,发挥了诊断、监督和导向的重要作用,但就赋能教育改进的路径建设方面仍不明朗。基于教育改进的PDCA模型构建观照教育监测评价价值理念、功能定位与流程环节等的理论框架,从问题诊断、策略制定、计划执行、经验推广等关键维度厘清教育监测评价中阻碍改进作用发挥的影响因素,助益教育监测评价体系及其配套制度建设的进一步完善和加强,进而形成“改进—监测评价—改进”螺旋式上升的科学闭环,促进教育监测评价的良性可持续发展。

教育监测评价是在党和国家有关方针政策指导下,利用全面客观的数据衡量教育质量、服务教育教学实践改进,进而引领教育高质量发展的活动。我国教育监测评价历经萌芽期(1978—2001年)、探索和试点期(2002—2014年)、建设和完善期(2015年至今)逐渐形成了以学生发展、学校办学和政府履职为主体评价内容的制度体系,发挥了诊断、监督和导向的重要作用。

伴随从规模发展到质量提升的转型期与关键期,我国教育事业也从外延式发展到内涵式发展、从教育大国向教育强国转变,对教育监测评价提出了超越过去主要是对教育发展规模和现状的衡量和判别的更高要求。2020年,中共中央、国务院印发《深化新时代教育评价改革总体方案》,明确指出要完善评价结果运用,综合发挥教育评价的导向、鉴定、诊断、调控和改进作用。2021年,教育部等六部门颁布《义务教育质量评价指南》,提出要“充分发挥评价结果对提高义务教育质量的引领和促进作用”。同年,《国家义务教育质量监测方案(2021年修订版)》出台,同样指出监测结果须用于督促问题改进、引领质量提升、服务决策咨询、支撑督导评估,并强调各地应因地制宜探索区域监测结果运用模式。可见,如何实现从“关于教育的评价”向“改进教育的评价”跃迁迭代,使教育监测评价更好地服务于教育发展,促进教育质量提升,已成为深化教育评价改革中一个迫切需要重点关注的问题域。

当前,学界就如何推动教育监测评价服务于教育教学改进的讨论集中在教育监测评价结果的运用上,通过总结学校、区域的运用经验,借鉴国际教育监测评价结果应用模式为我国教育监测评价结果应用路径的建设提出意见建议,并尝试自上而下地从组织实施、制度保障等方面构建教育监测评价结果应用的机制。总体来看,已有研究为教育监测评价改进功能的发挥作出了有益探索,但仍较为有限。一则局限于结果运用,未能就教育监测评价全流程体系中阻滞改进的因素进行深入分析;二则囿于教育监测评价本身,未能将教育监测评价、教育改进等多个视角串联,揭示并打通从教育监测评价到教育改进的“路径黑箱”。本研究尝试基于教育改进的模型和方法观照教育监测评价的价值理念、功能定位与流程环节等,多视角、多维度厘清影响教育监测评价赋能教育改进的阻碍因素,进而形成“改进—监测评价—改进”螺旋式上升的科学闭环,促进教育监测评价的良性可持续发展。

一、教育改进与教育监测评价双向赋能的理论框架构建

教育改进的模型方法植根于实用主义哲学,旨在通过系统设计、测试、实施和扩大变革,实现质量的持续改进。教育改进是教育监测评价的基本价值定位,教育监测评价是实现教育改进的核心环节和持续动力,二者相互赋能、双向嵌入、密不可分。

(一)教育改进的基本模型方法

教育改进的基本模型(见图1)通常被称为“戴明环”,由美国质量管理学家爱德华兹·戴明所完善,主要包括计划、执行、检查、调整四个环节,目的在于使事物在循环上升的过程中向预定目标发展。具体来讲,“计划”阶段包括问题诊断、策略制定和创建测量。其中,问题诊断旨在对阻碍改进的真问题进行识别,是教育改进的起点。策略制定是在科学证据的基础上对问题进行决策,以保障教育变革的有效性。创建测量则是根据选定的策略方法设计跟踪评估指标,为后续的检查和调整打下基础。“执行”阶段是指执行改进计划,并在执行的过程中根据所创建的测量指标收集数据。“检查”阶段在于确证教育变革是教育改进的过程,通过比较改进前后的纵向指标衡量变革的成效,为经验的总结、分享和下一个实践探究的循环作准备。“调整”阶段是在总结反思的基础上将得到的经验进行固化和推广,对仍存在的问题为下一个PDCA循环作好准备。

(二)教育改进与教育监测评价双向赋能的内在逻辑

以教育改进的基本模型为基础凝练观照教育监测评价的关键维度并解构为具有可操作性的具体要求。在改进共同体的协同下,将相关要求嵌入教育监测评价的流程体系及其内蕴的价值理念、功能定位之中,由此构建教育改进与教育监测评价双向赋能的理论框架(见图2)。从教育改进的PDCA模型来看,关键维度在于问题诊断、策略制定、计划执行及经验推广。其中,问题诊断指实现教育改进的过程必须从庞杂的调查和数据中提取出具体问题链,即谁的问题,什么问题,什么时间,什么地点,什么原因。这就对教育监测评价提出了由学理性向前瞻性、预警性、跟踪性、需求满足性研究范式转变的要求,尤其需要注重对影响教育质量的关键因素的深度挖掘以及对教育系统问题的检视,有助于解决当前教育监测评价存在的教育一线实践人员看不懂监测评价结果的问题。策略制定要求基于来自教育实践场景的证据进行决策,落实在教育监测评价中即基于监测评价数据进行证据的生产和利用,并注重通过系统综述、元分析等方法对证据进行二次转化,构建循证证据库,有助于解决当前教育监测评价中存在的相关主体不会运用监测评价结果进行决策和改进的问题。执行计划则需要持续的动力来源,这就要求教育监测评价进一步完善案例研究、后效评估等激励保障制度,激发利用教育监测评价结果进行教育教学改进的内生动力。经验推广一方面要求建立证据共享机制,扩大证据库的服务范围,另一方面则需要继续加大对教育监测评价、证据库的宣传力度,以提升教育监测评价及相关改进经验的影响力。

同时,教育监测评价在“监测指标研制、监测工具研发、监测抽样与数据采集、监测数据评分与清理、数据库管理与分析、监测报告研制以及报告结果反馈”整体流程体系中回应和服务于教育改进提出的具体要求,并在此过程中反向打通教育监测评价助推教育改进的路径,实现教育改进与教育监测评价的双向赋能。此外,教育改进强调改进不能由单一主体而是由包括所有变革活动的多学科、多视角的改进共同体进行,第四代评估理论也强调评估是遵循建构主义范式,经由利益相关者互动协商所形成的共同建构的过程。由此,需要构建教育行政部门、中小学、第三方机构、高校等相关专家组成的改进共同体以在双向赋能中起到桥梁和纽带的作用。

二、教育改进视域下教育监测评价的现实样态

根据前述构建的教育改进与教育监测评价双向赋能的理论框架对我国教育监测评价的现实样态进行审视和反思。基于教育改进模型中所提出的问题诊断、策略制定、计划执行、经验推广等重点维度,从“改进—监测评价”路径中探寻教育监测评价的生长点和需进一步完善的着力点。

(一)问题诊断:教育监测评价挖掘问题的广度、深度有待加强

从现有已开展的各级各类教育监测评价实践来看,对于教育问题的挖掘尚有待进一步加强。其一,教育监测评价内容的问题导向不足。当前教育监测评价在总体上尚未突破学科分立的测评内容形式,未能把握影响学生发展的核心要素。部分地区在自主监测评价指标研制的过程中重软硬件指标、轻内涵发展指标,重结果型指标、轻结构型指标,难以对教育政策和实践中的重点、热点、难点问题进行积极、有效回应。其二,教育监测评价数据的分析和挖掘有待加强。不少地区虽开展了对监测评价数据的进一步分析,但分析过程中或单一孤立分析指标,或呈现指标的表象,仅“认定”几个薄弱指标,忽略教育质量相关因素间的相互影响,缺少对地区教育质量的综合审视与深入诊断,对问题的现象、原因和改进的分析不够透彻。其三,缺少数据互证,未能深入教育现场挖掘真问题。监测评价结果仅能为复杂的教育现象提供一种解读和评析视角,只有在其基础上回到真实的教育现场进行专项调查研究,收集多角度、多层面证据,才能在真实的互证中探寻“真优势”和“真问题”。当前,仅有浙江省、江苏省等少数教育发达省份开始探索就监测评价中反映的关键问题、典型问题和社会关注的热点问题等进行深入的专项研究,大多数地区仍仅止于监测报告。

(二)策略制定:教育监测评价不足以充分支撑循证决策及改进

教育监测评价被广泛视为生产与转化证据的重要途径,经监测评价数据科学加工转化的监测评价结果由于具有系统全面、方法专业科学、数据可量化且纵横向可比等特性,已成为各个国家支撑教育决策、开展教育改革的重要依据。如德国将PISA、TIMSS、TALIS等国际大规模教育评价的结果与德国国内的学业水平评价、学校评价、国家教育发展评价等结合到一起,“为所有州的循证教育政策奠定共同基石”。当前我国大部分区域、学校尚无法在教育监测评价数据的基础上形成用于循证改进的证据。主要原因在于,一则缺少专业改进共同体,证据的生产和转化存在阻碍。专业改进共同体是多元主体以教育质量提升为核心目标,经由协作互商而建立并稳固起来的专业性改进组织,是证据的生产者,是改进工作的中坚力量。目前虽有部分地区建立了行政部门统筹、专业机构指导、一线学校行动的监测评价结果应用的工作模式,但相关主体之间缺少互动协商的共同建构机制,存在“等、靠、要”现象,自身主动性不强。教育问题往往涉及教学教研、学校管理、经费投入等各个方面,需要多学科融合、跨部门合作以进行制证和循证改进。专业改进共同体的缺失使监测评价数据转化为证据的路径不畅。二是循证证据库建设的欠缺,制约了相关证据辐射作用的发挥。循证证据库利用系统性综述、元分析等研究方法,对各类教育改进项目的高质量效果评估研究结果进行证据整合,是循证改进的重要保障。目前有部分地区尝试基于监测评价结果探索建设案例库,但仍停留在对案例的整合汇总阶段,缺少元分析且不成体系,造成一次证据的资源浪费,也难以为薄弱地区、学校的改进提供经验和参照。总体而言,当前证据的生产与转化问题尚未解决,循证证据库的建设更是空白点和盲区。

(三)制度保障:教育监测评价尚无法为改进提供持续动力

改进行动的持续落地离不开配套激励制度的助推。然而,一方面,当前各地对于改进的推动仍以限期整改、单方面问责为主,有关部门、学校利用教育监测评价进行改进的内生动力不足。这种单方面问责既使改进压力大多落在了学校、教师头上,又使区域内改进行动以“大一统”的方式开展,有关部门、学校只能“自上而下”被动地按照区县的统一要求进行全面整改,难以纵向深入,导致教师研究动力缺失、学校个性特色埋没。另一方面,关于教育改进项目的后效评估仍是“黑箱”。其一,纵向监测评价体系的不完善使监测评价结果难以反映改进效果。目前国家层面的教育监测评价更侧重通过大尺度评估了解整体质量状况,测评周期长,难以及时反映中微观层面改进项目的效果。地市、区县层面的教育监测评价则囿于各地对监测的认识不清晰,对自身工作定位和内容的模糊以及专业力量的欠缺,多与国家级、省级内容重合,不仅造成“多头评价”,其结果同样未能有效反映改进效果。其二,跟踪评估制度的不健全使跟进式研究项目持续动力不足。跟踪评估主要通过二次监测、专项督导评估等方法,分析比较纵向增值情况,实现对改进效果的评估,其相较于监测评价尺度更小、落点更具体,问题导向更明确。跟踪评估的缺位使改进项目难以及时根据具体改进效果进行调试,改进行动的有效性大打折扣。

(四)经验推广:基于教育监测评价推广教育改进经验的力度不足

总结基于监测评价结果进行教育改进的成功经验,及时将这些经验进行推广,充分发挥先进地区、学校的辐射作用,是形成教育监测评价促进教育质量提升和发展的良性循环,有力推动区域教育生态不断优化的重要手段。但当前关于改进经验的总结、提炼与传播还是相当薄弱的一环。这一方面是因为教育监测评价结果本身的传播范围有限。教育监测评价具有技术性、专业性、学理性强等特点,只有由专业性向通俗性、由理论性向实践性转化,才能更广泛地为社会公众所理解和认可,进而实现社会范围内的传播。现有教育监测评价结果呈现基本为大篇幅、扁平化的数据分析报告,且大多仅在相关组织机构内部传播,鲜少利用新兴技术和多元媒介进行转化加工,覆盖面和影响力皆有所不足。另一方面,对利用监测评价进行教育教学改进、促进质量提升的先进典型经验的宣传也不到位。对优秀案例、有效证据进行宣传推广,既能提高相关者参与改进项目、进行证据生产的积极性,又能为薄弱地区提供改进经验和证据。目前虽有部分地区通过召开经验分享会、创建公众号等方式尝试对证据进行宣传,但还未能形成长效化宣传机制和路径,大部分改进成果和经验淹没在浩如烟海的数据中,未能起到经验辐射、以强带弱的示范作用。

三、打通教育监测评价助推教育改进的路径与策略

基于教育改进模型中提出的关键维度及具体要求,针对当前教育监测评价中存在的现实问题进行系统性完善和加强,努力打通教育监测评价切实促进教育质量提升的路径通道,实现“监测评价—改进”的持续发展与螺旋式上升。

(一)增强教育监测评价的问题导向,挖掘教育发展中的真问题

改进在本质上是逐渐发现和解决问题的过程。只有正确甄别真问题,才能进一步聚焦改进方向与行动目标,从而解决问题,实现改进。

首先,加强对各级监测评价指标内容的开发。当前,我国教育监测评价已经形成了层次清晰的国家、省、市、区县的纵向结构,未来需重点考虑各级各类教育监测评价的价值定位与实践旨归,在此基础上探索实现指标设计综合性与指向性、一般性与特殊性的相统一,在避免“另起炉灶”“多头评价”的同时,推动监测评价内容指标的层层递进、逐级深入,体现问题分层诊断、分层解决的特点。在具体指标设计中,既需要顶层统筹基础指标,注重呈现教育质量的核心、共性元素,重点考虑影响学生发展和教育质量的全要素特征;又要因地制宜设计自主指标,回应各级教育改革发展的热点问题,体现各级教育系统的发展导向与需求。

其次,加强对监测评价数据的深入挖掘,推动多源流教育数字基建。精准揭示监测数据背后的真实问题、隐性问题和苗头问题,必须深挖多头数据,避免用单一数据作简单推论。一是从监测评价数据本身入手,对不同主体、不同领域的监测内容及数据作关联分析。二是借助人工智能、大数据挖掘、区块链等数智技术打造以教育监测评价数据为主、多源流教育数据交互的统一的教育管理数字化平台,进而链接多层面、多维度的数据对相关问题进行确证,以更加整合融通的视角从教育系统的输入、过程、输出的整体环节诊断和挖掘问题。

最后,回到教育现场,开展基于监测评价的深度调研。教育具有复杂性,监测评价结果仅能对教育真实情境进行侧写,不能直接据其结果判断所反映的问题和原因是否为“真问题”和“真原因”。因此,有必要针对监测评价中的预警数据开展专项深度调研,通过调研结果与监测数据的量质互证,为数据诊断结果提供充足的事实依据,通过联合会诊查找问题根源,探寻解决路径。具体而言,基于教育监测评价结果的深度调研应在改进共同体的指导下,首先在监测评价数据反映问题的基础上立足区域教育发展导向和需求明确问题的优先级,就其中重点、热点和难点问题剖析式拆解为问题链并细化为调研要点;其后根据调研要点设计相应调研方案和工具;最后实施调研,收集数据,并将调研结果与监测数据进行统合分析和转化,为后续循证决策和改进提供证据基础。

(二)加强专业队伍和平台建设,实现基于教育监测评价的循证改进

“所有的改进都要求变革,但并不是所有的变革都能导致改进。”只有得出有效的证据产物,并以此为基础进行循证干预和决策,才能推动改进的发生。证据不同于普通的数据和信息,必须经过科学加工以具有高度的科学性、系统性、全面性和有效性,而其中整个过程都需要专业队伍、专业平台作为支撑。

第一,组建由政府、专业评价人员、学校教师及教育管理人员等构成的专业改进共同体,并为多元主体构建协同合作机制,以保证证据生产的持续进行。持续改进的基本原则包括组织层面的整合深度、工作系统情景化程度、规律性和高频率,即改进工作持续进行的条件是成为常态化日常工作,成为系统而非个人产出,且规律性进行。因此,需从上述三个维度对改进共同体的协同合作机制进行完善。其一,形成嵌入改进工作的系统工作网络,将教育监测评价赋能改进活动中涉及的深度调研、案例研究、跟踪评估等各项支持性组织程序制度化、常态化、长效化纳入有关主体的日常工作,提高整合深度的同时避免因增加相关者负担而削弱改进内发力。其二,构建积极行动的网络化联动机制。为推动改进行动的持续进行,需要促使一线教育实践者、专业评价团队、教育行政部门人员等利益相关者均围绕改进问题链积极贡献专业知识或经验,避免过度陷入教育行政体系的工作逻辑而将教育一线实践者视为提供数据和被动接受的一方,异化为改进过程中的“局外人”。其三,构建稳定高频的改进机制,让利益相关者均对改进计划和机制有清晰认知,避免“东一榔头西一棒槌”式地随意进行。

第二,基于监测评价数据建立专业化、结构化、高效率的证据库,提高证据利用效率,实现循证改进的良性循环。证据库的构建分为明确主体、生产证据、分析评价证据、模块化整理和呈现证据、动态运行五大步骤。其一,明确证据库构建的主体。循证证据库的构建属于改进活动的重要一环,其主体即专业改进共同体。其中,政府部门通过政策指导和相关措施,统筹教育证据库建设,提供资金支持,并负责加强对证据库投入经费的监督和考核,确保教育证据库的长效发展;一线教师及高等院校、科研机构教育研究者等负责证据的生产和评估。其二,生产证据。研究人员利用监测评价数据,通过严谨、系统、客观的程序,转化为关于教育活动、教育项目、教育政策的可靠有效的证据。其三,分析和评价教育证据,保障证据的质量。基于监测评价生产的教育证据主要根据后效评估结果进行信效度和可行性分析,同时利用系统评价和“meta”分析等,结合文献研究结果进行综合评估和研判,以保证并不断提升证据质量。其四,模块化整理和呈现教育证据。主要由一线实践者与专家团队对证据进行内容界定及归属判断,模块化匹配录入证据库中。模块式呈现方便使用者检索,能够实现用户友好,降低证据使用壁垒。其五,及时对证据库中的证据进行更新和修订,确保证据和证据库的动态持续发展。

(三)建立基于教育监测评价的案例研究和后效评估制度,形成教育改进的不竭动力

在循证改进的过程中,还需注重对于案例研究、后效评估等配套制度的建设,以推动改进的持续发生。其一,案例研究相较于强制问责更能提高一线教师和管理者等微观主体参与改进的积极性。案例研究或称课题研究,是由教育行政部门主导,在教育监测评价反映问题的基础上设立有关课题,由学校、教师自主申报立项进行问题解决的监测结果运用模式。根据日本学校改进研究学者佐古修一提出的“研究—计划—实施—回看”模型,即首先对具体教育问题进行研究和把握(R);然后将问题转化为课题,并设计解决方案(P);之后践行解决方案(D);最后观察学生的变化,检视实践成果,形成新的认识(S)。这种以解决课题为重点的研究模式对于微观主体而言更具体、高效。在实践中,案例研究正在成为自主改进的重要抓手。如包头市每年召开全市义务教育学业质量监测结果运用优秀案例分享会,以表彰先进、推广经验,提高了教育基层实践者参与教育研究和改进活动的积极性。其二,后效评估是检验教育改进项目能否有效促进教育教学质量提升的关键环节,证据的有效性和教育改进目标的达成度都需要经过后效评估来检验。通过检核改进目标的完成度、问题、原因和后续计划,在不断对标和复盘中凝聚人心,形成教育改进的不竭动力。后效评估一方面可以二次监测的形式展开。通过比较核心指数前后两次或多次监测中的纵向增值幅度和变化情况衡量改进项目的有效性。为实现纵向可比,尤其要注重等值测量、时序模型等技术在监测评价中的开发和应用,为实现跨年度比较提供重要技术支撑。另一方面,若改进项目中涉及监测评价外的指标,则有必要在改进工作开始前由专业改进共同体指导创建专项测量,开展跟进式专项督导评估。此外,由于区域、学校间的发展水平不同,衡量改进效果的标准也需因地制宜,在解读与反馈改进效果时充分考虑各区域、学校的基线水平和实际情况,避免“一刀切”。

(四)充分发挥媒体力量,宣传推广基于监测评价的教育改进典型经验

媒体对数据的解读常常会影响公众的理解,从而影响教育政策话语实践。特别是全媒体时代,充分利用媒体对教育改进经验进行宣传推广,对教育改进的持续发展、循环上升及教育舆论科学导向的发挥有着至关重要的作用。为扩大教育监测评价及相关改进经验的影响力,首先,应注重优质内容的建设和生产,特别是对社会所关注的教育热点问题的回应。这一方面可以通过将监测评价结果本身精简提炼为核心要点问题,另一方面则建立证据共享机制,同时对其中典型区域、学校的改进措施和成效等进行整合和深挖,并通过多种叙事手段编辑形成优质信息内容。其次,探索如何利用直播云台、AI主播、短视频等多元媒介发布具有“亲和力”的监测结果和教育证据库信息,提升公众对教育监测评价的关注度和认可度,提高教育证据库的知名度和影响力,以此激励优秀地区、学校发挥辐射作用,促进地区教育生态的良性循环。例如,依托资讯平台发布可视化的反映教育质量发展状况的纵横向数据,借助视频平台传播教育改进中的故事,利用微信公众号等社交平台分享先进经验和有效证据等。

(本文编辑:蒲丽芳)

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部