黄郭钰慧 张宁娟:指向建成教育强国的教育评价改革——治理难题及实践进路
发布时间:2025-05-21 10:56 浏览量:2
民小编说
教育评价是建成教育强国的重大掣肘,要健全考试招生法律的制定,做好素质教育评价的顶层设计,完善特殊群体的评价办法,实现高标准规定的正式教育的正式评价;要重视教师在“评价共同体”中的主体地位,建立教育教学述评制度,探索大团队式的评价模式,实现以人为本的正式教育的非正式评价;要研制校外教育质量监测评估指导意见,引导多元主体有序参与评价实施,完善分类评价指标体系,构建聚同化异的非正式教育的正式评价;要发挥好信息技术的“倍增器”作用,构建全链条覆盖的非正式教育的非正式评价。一起来看中国教育科学研究院教育评价与督导研究所助理研究员黄郭钰慧等人的阐述——
《教育强国建设规划纲要(2024—2035年)》专章强调:深化教育综合改革,激发教育发展活力。首条即为:深化教育评价改革。可以说,教育评价是教育强国建设的“牛鼻子”,[1] 亦是建成教育强国的重大掣肘。自2020年《深化新时代教育评价改革总体方案》出台以来,学界就教育评价改革的制度逻辑和演进路径、“五唯”传统评价的弊端和综合素质评价的构建、智能化测评和技术应用等主题进行了有益探索,但教育评价改革仍处于深水区,很多问题根深蒂固、盘根错节,亟待更加充分、深入的探讨。
一、教育评价改革推动教育强国建设的重大意义
(一)教育评价改革是教育综合改革的关键环节
教育评价体系在教育生态系统中具有独特的“双向耦合”特性:既构成教育行为的反馈终端,又形塑教育实践的价值坐标,使其成为教育综合改革中关键环节。一方面,教育评价改革关乎育人方式、办学模式、管理体制、保障机制改革等方面,关乎政府如何管教育、学校如何办教育的重大问题,一旦教育评价改革有所突破,教育理念、体系、制度、内容、方法、治理现代化等都将实现全方位发展,教育综合改革都将活起来,所谓“一子落而全盘活”;另一方面,教育评价改革牵涉千家万户的利益和社会利益的再分配,以教育评价改革为牵引,能最大限度激发学生、教师、家长、教育行政管理者乃至全社会推动教育强国建设的积极性。
(二)教育评价改革将“政策势能”转化为支撑强国建设的“发展动能”
教育评价体系作为人力资本增值的“质量控制器”,是破解关键领域人才瓶颈的战略支点,其通过“三维协同驱动模型”—评价标准革新触发人才培养模式变革、人力资本结构升级赋能产业链效能跃迁、经济动能反哺教育系统优化,形成创新人才的有效供给。教育评价改革通过系统性制度创新,将教育改革的“政策势能”转化为支撑强国建设的“发展动能”。进一步说,教育系统与经济社会的适应性优化,将通过“教育—经济—文化”的协同演进激活中华民族的文明基因,为中国式现代化提供战略支撑,为中华民族伟大复兴奠基。
(三)教育评价改革推动中国参与全球教育治理,向世界贡献中国智慧
教育评价改革是一项世界性、历史性、实践性的难题。近年来,中国特色的教育评价改革理念、成果逐渐为全球教育治理体系变革贡献了力量。但总体而言,全球教育评价体系仍由OECD的PISA框架、IB课程评价标准等西方范式主导,其隐含的“工具理性”与“个体竞争”逻辑难以适配人类命运共同体理念下的教育治理需求。未来,我国还需要进一步以教育评价改革为契机,推动在全球教育治理中形成中国方案,使全球教育治理从“中心—边缘”结构转向“文明共生”的新模型。
二、反思当前教育评价改革的治理难题
当前,教育评价改革虽已破局,但在教育评价治理的广度与深度方面还存在不足。反思当前教育评价改革的治理难题,可以为厘清教育强国建设中教育评价改革的目标定位和路径选择提供有益思路。鉴于教育有正式教育(国民教育体系)与非正式教育(国民教育体系之外一切泛在教育行动)之分,评价亦有正式评价(已有较为完善的评价标准指导)与非正式评价(还未出台较为完善的评价标准指导)之别,[2] 本文基于四类教育评价领域,即正式教育的正式评价、正式教育的非正式评价、非正式教育的正式评价以及非正式教育的非正式评价,分类澄清当下教育评价治理的困惑。
困惑1:正式教育的正式评价是否落实了素质教育理念?
以中高考为代表的正式教育的正式评价,其“综合素质评价”的实践悖论折射出制度设计的深层矛盾。这主要源于以下三个原因:一是“不会用”。综合素质是一个被“熟知”的概念,但未必被“真知”,比如它与日常教育教学实践的边界,它在评价过程中所需要收集的信息和数据等,许多评价主体并没有清晰的认知。二是“不愿用”。综合素质评价不像考试分数那样“硬挂钩”受到重视,并且大部分综合素质评价都是突击完成的,结果也都是优秀良好,区分度不高,因此评价者不愿使用。三是“不敢用”。尽管有些学校将综合素质评价纳入招生考试的硬指标,但其公信度常常受到质疑,导致的教育公平问题也制约了综合素质评价的使用。
困惑2:正式教育的非正式评价是否观照了评价共同体的个体发展?
课堂评价、德育评价、体育评价、美育评价、劳动教育评价等非结果性评价和非认知评价可被视为典型的正式教育的非正式评价。此类评价表面上看无比细化,[3] 然而在实际操作中,由于缺乏评价标准,评价者的评价能力、评价方法极易受量化主义的影响。教师需要面对烦琐的考核任务,导致评价存在追求“学校整体发展”与“个体自我成长”的“钟摆现象”。深层次原因是作为评价共同体的主体性缺席。[4]
困惑3:非正式教育的正式评价是否实现了多元评价的专业性?
非正式教育是学校教育的重要补充,在满足个性化需求方面具有独特价值。特别是基于兴趣和实践教育需求涌现的营地教育基地、研学旅行机构等,其评价与监管亟须引入相关机构和主体的专业参与。没有教育专业评价的参与,非正式教育的多元评价容易陷入“公说公有理,婆说理也长”的混沌之中,以及“多种评价难以融通”的困境之中。[5] 这种评价格局在一定程度上削弱了从业人员的公信力,进而影响整个社会的治理成效。
困惑4:非正式教育的非正式评价是否规避了技术的局限性?
随着各级各类学校数字化教育平台的普及使用,学生、家长、教师甚至社会人士都可以通过在线平台、社交媒体等对教育过程、教学资源和教育成果发表看法。这种“人人皆评”的非正式评价,打破了传统评价体系的封闭性,让更多声音被听见,有助于优化教育流程、整合教育资源,为学习者提供了更加高效、灵活和个性化的学习解决方案。但也存在许多问题,一是评价主体对现有技术的驾驭能力不足,二是技术只是一种工具,而教育是蕴含人性灵魂的活动,[6] 智能化评价有着难以规避的局限性。
三、指向教育强国建设的教育评价改革实践进路
(一)正式教育的正式评价要实现高标准规定
1. 健全考试招生法律的制定
依法治理是教育评价发挥治理功能的基石,考试招生立法应着力解决好三个问题:一是严格限定国家教育考试的种类和范围。需要注意的是,条文表述应该将没有争议的国家教育考试种类予以列举,目前不能确定的一律不予列举。二是合理设定国家教育考试行政主体的管辖权。建议法律就不同的国家教育考试类型明确相应的管理责任主体,包括事务管辖权、地域管辖权、级别管辖权等。三是建立国家教育考试争议的专门处理机制。考试招生与考试承办机构主体可能产生各种各样的争议,建立招生考试争议的专门处理机制,并从法律上予以保护。
2. 加强素质教育评价的顶层设计
造成综合素质评价“不会用”“不愿用”“不敢用”的关键原因是育人标准抽象难用。针对这个问题,建议做好顶层设计工作:一是逐层细化国家育人实施标准。坚持立德树人,形成教、学、评一致,体现核心素养导向的育人实施标准,确保标准是抽象与具体相统一。[7] 二是量化和质性指标合理并举。一方面要汇总已有量化标准;另一方面要探索质性标准的合理使用,对量化数据进行互为补充的说明。三是推动使用标准。按照“国家标准必选”—“地方标准限选”—“校本探索创新”的模式,确定具体的教与学标准,并落细落实。2023年山东省教育厅印发《关于推进义务教育学生综合素质评价工作的指导意见》,实现了“规范+特色”综合素质评价的发展。市、县(区)、校三级指标体系灵活配置,省级统一定义品德发展等五个一级指标,地市和区县根据自身实际情况细化二、三级指标,学校结合自身办学优势开发特色指标。这一实践一定程度上实现了“各美其美,美美与共”。
3. 完善特殊群体的评价办法
一方面要关注在某一学科具有特殊潜力的学生。虽然我国部分大学已开辟了针对拔尖创新人才的超常规录取通道(如清华大学丘成桐数学科学领军人才培养计划),但总的来说还未形成规模化、有保障的实践。中高考录取补充机制还需要在法律制度上综合发力,平衡好“全面均衡”与“单项冒尖”的关系。另一方面要关注农村地区、西部地区、民族地区的真实教育需求。教育评价改革要更关注基层县域、农村地区的教育状况,因为中国2000多个县容纳了全国50%以上的学生,他们才是中国教育的真实底色。[8] 初高中时期的评价诊断、导向和激励对青少年是否能够形成一生受用的品格和素质至关重要。探索这部分群体的综合素质评价、考试招生制度录取补充机制还需要因地制宜,满足当地学生的真实教育需求。
(二)正式教育的非正式评价应追求以人为本
1. 重视教师在“评价共同体”中的主体地位
一是研制教师开展评价工作的指南,明确教师需要承担的具体职责以及各类评价的核心内容。并且其研制过程要让教师自主选择,参与关键评价指标的制定。[9] 二是重视评价诊断的应用,淡化评价本身,强化评价诊断、激励、导向的作用。例如北京十一学校改变每学期“评教评学”为“教育教学情况调查”,意在告诉教师这项工作不是“找事”的评价,而是以研究的态度诊断和改进教育教学服务。三是挖掘“隐形”的教师道德实践和情感付出。教师在与学生日常相处过程中的情感投入最能体现其工作的本质特征,[10] 往往是这些隐形的、难以量化的事件影响了学生一生,应当被总结、提炼,以激励教师回归育人本质。
2. 建立教育教学述评制度
一是立足学业质量标准开展学情诊断,保障述评内容的科学性和连续性。二是注重与学生的互动和对话,引导学生不断内化和反思,通过学业述评加深学生对自我、课程、学习的深度理解,帮助学生学会学习。三是依照课程标准研制《校本教学述评框架》,为教师提供工具,避免述评的随意性与盲目性。例如上海市奉贤中学附属小学以中小学教师教学述评制度为重要抓手,搭建学业述评指标框架,优化学科学业评价指标,从兴趣与习惯、态度与品质、经历与学习成果三个维度开展过程性评价。
3. 探索大团队式的评价方式
任何学生的成长不是由一个教师独自支撑的,而是一个团队。在非正式教育的情境中,班主任的“杂事”越积越多,评价压力倍增,这时候就特别需要涵养团队工作的精神。一方面要增添多样的团队成员。例如深圳大学附属外国语小学充分利用校园多种角色对学生开展立体化德育评价:“卫生小标兵”的评判员是清洁工,“节约食物小标兵”的评判员是食堂工作人员,这样提高了多元主体参与学校治理的积极性,增强了团队凝聚力。另一方面建立个人成果与团队成果相协调的激励机制,根据教师在团队中的个人投入指标,考虑团队成果与个人绩效直接挂钩,鼓励教师以团队形式加强协作,用统整、正面的能量形成对学生良好的影响。
(三)非正式教育的正式评价应坚持聚同化异
1. 研制校外教育质量监测评估指导意见
目前,国内仅部分地区有校外教育评估项目,尚没有专门、系统、统一的校外教育质量监测评估体系。这种情况下,对于一些急难愁盼的问题应鼓励地方先行探索,提炼经验后再进行辐射推广。例如2021年上海市教委等十三部门联合发布《关于加强和改进新时代上海未成年人校外教育的意见》,为上海的校外教育质量监测评估提供了根本遵循。随后上海市成立了校外教育质量评测中心,率先对公益性校外教育单位进行评测。
2. 引导多元主体有序参与评价实施
为确保有序的评价活动,一方面要发挥党委的核心领导作用和行政统筹管理职能。例如海南省和上海市均以教育督导形式开展公益性校外教育评价。教育行政管理部门发起评价活动,负责决策的督导专家组直接进入机构现场实施考察和收集数据。评价结果以督导意见书为主要形式,反馈至各被评机构以促进质量提升与改进,同时递交至教育行政管理部门,并在一定范围内向社会公开。另一方面要探索学校、校外教育行业主体、专业评价机构、家长和社会主体的有效评价参与机制,在评价指标构建、评价队伍组成、评价结果反馈等环节纳入多主体参与。[11] 需要注意的是,要进一步明确不同主体在评价工作中的功能地位,形成家长和社会主体充分反映真实需求、专业机构提供专业智慧、学校主体与校外教育和谐联动的优势互补的格局。
3. 完善分类评价指标体系
一是探索艺术、科技、体育、文化等不同领域的校外教育评价指标建设。在指标制定上纳入政府部门、学校、家长、领域专家、行业组织等多元主体,使评价指标能切实反映特定领域的学习特点,顺应学生成长规律。二是研究跨学科校外教育评价标准。针对科技创新类、社会实践类等综合性校外教育活动,广泛调研国内国际相关经验,征询多学科专家意见,拟定独立评价标准,尤其要关注创新思维、社会情感能力等能力评价,促进学生成人成才。三是发挥好主流媒体的宣传作用。邀请参与官方标准制定的专家对指标体系进行官方解读,形成积极的舆论导向。
(四)非正式教育的非正式评价应构建数据全链条覆盖
1. 重视数据采集
重视对“学生友好”和“教师友好”的评价技术。在不打扰学生或教师自然教学情境的前提下,应兼顾学生、教师与真实环境的互动需求,全过程、多角度、客观化记录学生、教师的基本数据。例如浙江省东阳市外国语小学打造的“全息学习场”集数智赋能、无感采集、综合评价、导航成长于一体,后台能自动识别学生并自动关联该生的评价。
2. 重视数据使用
一方面重视评价结果的反馈激励。首先要采用学生或教师能理解的方式呈现数据结果,鼓励学生和教师开展自我评价;其次搭建线上诊疗专家库和对话机制,由专家线上提供诊疗建议或解决策略;同时搭建互帮互助协作平台,拓宽对话交流渠道,形成良好的学习社群。另一方面要提高教师数字素养。首先要制定教师数字素养提升指导意见,将教师数字素养作为学校督导评估考核的重点内容;其次在“以用代训”的过程中推行常态化培训模式,建立时间弹性可选择的培训机制,[12] 提供线上线下融合的泛在化培训服务,鼓励教师广泛深入使用新技术,以加深理解并激发其在教学实践中的创新运用。
3. 重视数据管理
构建数据开放共建共享协同机制。一是地方应针对数据开放共建共享协同机制出台相应的保障政策和指导意见,明确数据开放主体的权利和义务,并建立起面向各主体参与数据开放共建共享的权益分配和激励机制。二是在这个过程中要赋予被评价者关于评价活动中各类信息采集和使用的知情权,例如所采集的数据类型、数据的处理及分析过程、评价结果的使用范围等,进而激励其支持和参与评价活动。三是注重技术伦理,完善个体隐私保护措施,利用数据安全、数据备份、隐私加密等技术,确保评价数据和教师隐私数据的安全。[13]
参考文献
[1] 张宁娟. 深化教育评价改革落实先立后破发展新定位[J]. 人民教育,2024(11):1.
[2] 周作宇. 论教育评价的治理功能及其自反性立场[J]. 华东师范大学学报(教育科学版),2021,39(08):1-19.
[3] 叶赋桂. 教育评价的浮华与贫困[J]. 清华大学教育研究,2019,40(01):18-21.
[4][9] 谷峥霖,马季,秦善鹏. 教师自我评价的主体性困境与突破[J]. 当代教育科学,2023(02):17-26.
[5] 刘云生. 新时代教育评价体系构建的中国路向[J]. 教育与经济,2023,39(04):3-12.
[6] 曾水兵. 什么是好的教育[J]. 人民教育,2007(17):60.
[7] 刘云生. 评价如何赋能素质教育发展—重庆义务教育评价育人公共服务体系的构建与实施[J]. 人民教育,2024(01):51-55.
[8] 林小英. 县中的孩子[M]. 上海:上海人民出版社,2023.
[10] 孟照海. 推进新时代教育评价改革难在哪里[J]. 人民教育,2023(20):15-19.
[11] 陈奕喆. 基础教育阶段校外教育评价体系比较研究—基于中国、美国、德国的实践经验[J]. 世界教育信息,2023,36(10):54-65.
[12] 李艳燕. 教师数字素养是教育数字化的关键软实力[J]. 中国民族教育,2024(02):18.
[13] 柴唤友,陈丽,郑勤华,等. 技术赋能学生综合素质评价:进展、挑战与路向[J/OL]. 现代远程教育研究,2023,35(03):40-46+54[2024-08-01].
文章来源|《人民教育》2025年第8期①扫码订阅2025年《人民教育》杂志