欢迎来到工作报告网!

教育大数据背景下智能测评研究的现实审视与发展趋向

医院社会实践报告 时间:2022-02-12 10:10:16


打开文本图片集

【摘 要】 人工智能、学习分析与教育大数据之间的相互融合使得学习评价由数字化的学习测评走向数据化的智能测评。从智能测评技术发展视角对国内外相关平台进行梳理和分析,发现智能测评平台存在测评目的异化、测评数据采集单一、测评分析缺乏深度、测评结果可视化水平低和测评反馈智能化薄弱五方面问题。本文从智能测评研究视角对国内外现状进行内容分析,把握研究态势与不足;在此基础上对智能测评发展的理论与技术趋向、目标导向进行阐释;最后提出智能测评服务模式,即以支持个性化学习为目标导向,以基于学习能力的学习练习智能匹配、基于内容掌握的个性化学习路径规划、基于活动参与的个性优势识别以及基于测评结果的知识地图描绘为服务支持,为将来智能测评发展与研究提供有益的启示。

【关键词】 教育大数据;智能测评;学习分析;机器学习;个性化学习

【中图分类号】 G642.0 【文献标识码】 A 【文章编号】 1009-458x(2018)5-0055-8

一、学习测评发展的现实困境与突破口

当前学校教育中对学习的测评侧重学习结果的显性表现,如测评得分、题目正确率、成绩排名等,对学习者的隐性行为关注较少,如对学习内容的掌握程度、协作学习活动内容的贡献度、达到学习目标的层级水平等。学习评价专家保罗和迪伦(Paul & Dylan, 1998)认为如果一个评价仅仅用于评定分数,内容上没有提供进一步的学习机会,评价就不是真正形成性的,只有评价揭示了学生思维的具体方面,借助这些方式才能进一步开展有效教学,并且运用所揭示的诊断性信息为学习者提供额外的学习机会。数字化环境下的学习评价既注重学生的总结性评价,更关注学生的形成性评价(Tomas, Borg, & McNeil, 2015)。评价的形成性本质不但存在于评价本身中,而且存在于评价与其课堂角色的交互中。如何对整个学习活动过程进行有效评价并判别出学习者在知识、能力和思维方面的真实水平是当前学习评价面临的现实困境。

近年来,教育大数据、学习分析和智能网络学习平台的逐步发展使得学习轨迹不仅能够得到记录进而形成全学习过程数据链,而且能够对学习过程和结果进行个性化分析和评测。而以深度学习、机器学习、自然语言处理等为代表的人工智能技术兴起,使得测评技术更加智能和精准,基于学习内容和结果可以对学习者的知识和能力水平进行智能化评测,以更好地服务于认知诊断。因此,我们可以借助大数据和学习分析技术对学习过程中的阶段性学习表现进行评价和归因分析,并结合学习者的个性特征定制基于内容掌握的学习路径,最终促进其对知识的深度理解和概念的掌握。

二、基于教育大数据的智能测评平台梳理分析

(一)智能测评平台的功能比较分析

为了解当前智能测评技术在实践中的应用和发展情况,本研究借助国内外搜索引擎对国内外有关文字书写、语音分析、测评考试等不同智能测评平台进行整理分析。在选取智能测评平台的过程中,以具备多元化、智能化、交互性、可视化等特征为依据,确保分析的智能测评平台符合本研究的需求。对平台的分析从使用对象、数据采集来源、分析内容、结果呈现形式、特色功能展现等方面进行多维对比,结果见表1。

可以发现,在分析对象上,平台较为关注学生在群体中的表现,其测评结果偏重于比较;在数据采集来源上,平台采用多种方式收集,既使用传统的试卷、问卷和量表,也使用动作捕获感应器、自然语音拾取等高科技手段;在分析内容上,当前国内外智能测评平台涉及的测评内容除以学业成绩、语言能力、实验操作能力等为代表的学业水平测评外,也涉及心理测量、学习自适应能力等非学业水平方面的测评;在数据类型上,结构化数据是目前各测评平台数据的主要类型,目的在于方便数据分析,并以可视化方式呈现最终结果。

(二)智能测评平台存在的问题分析

通过对国内外主流智能测评平台进行梳理分析发现,当前智能测试平台存在以下五方面问题:

1. 测评目的异化

研究者在分析上述智能测评平台的过程中发現,无论从所面向的使用对象还是分析内容的组成上看,均存在较为明显的测评目的异化的情况(该现象在国内实践中尤为突出),即测评目的在于选拔和甄别,而忽视测评的诊断、反馈和促进功能。如测评平台关注区域教育质量监测及对比、学校办学质量分析、教师教学质量分析、学生学业成就分析,而提供的诊断报告集中在基于常模参照测量下的排序和比较,具有较为明显的“排位次”现象。测评需要为教师精准教学和学生高效学习提供有效支持,如果盲目追求测评的选拔和甄别作用,缺少基于测评结果的教与学的优化,则会造成测评活动舍本逐末无助于教与学改进的困境。

2. 测评数据采集相对单一

数据采集的内容和形式将直接决定后续分析的广度和深度。从数据内容上看,当前智能测评平台主要以学业成绩数据为主,缺乏对学生日常学习行为数据、家庭背景信息等重要内容的采集;从数据类型上看,已有分析数据以结构化数据为主,如学生的试卷分数、调查问卷结果、在线学习时间、点击次数等,缺乏对更能体现学生情感、价值观、学习品质和学习思维等非结构化信息内容的采集;从数据收集时间跨度上看,以阶段性、结果性数据为主,缺乏对日常关键事件和典型表现等行为数据的收集。当前,无论是数据内容和类型,还是数据收集的时间跨度,现有测评平台尚未达到智能测评对数据采集的要求。

3. 测评分析缺乏深度

受限于测试数据采集较为单一,目前各测评平台在分析内容和分析方法上的设计也较为简单。在分析内容上,主要是对采用问卷、试卷等测量工具获取的区域教育质量、学生学业成就等方面信息进行分析;从分析方法上看,以描述性的量化统计分析为主,缺乏质性分析及纵向和横向的对比分析,缺乏从多角度、多层次分析同一对象;从测量统计理论的应用上看,主要以经典测量理论作为理论依据,缺乏对于更能反映学生认知过程、数据处理精度更高的认知诊断和项目反应等理论的应用。因此,分析结果往往较为片面,无法形成有效的证据链,可信度不高。

推荐访问:趋向 审视 测评 现实 智能

热门文章