Professional Documents
Culture Documents
基于学习测评数据的个性化评价建模与工具设计研究 牟智佳
基于学习测评数据的个性化评价建模与工具设计研究 牟智佳
DOI:10.13811/j.cnki.eer.2019.08.012 学 习 分 析 与 测 评
基于学习测评数据的个性化评价
建模与工具设计研究
[摘 要 ] 大量的测评练习是基础教育中开展学习测评的一种常态化评价活动,学习者由此产生的各类测评数据为
分析其知识掌握水平和目标达成情况提供了数据基础。 首先,对个性化评价以及教育测量理论进行了分析,将研究问题
与理论的优劣进行耦合,确定以布鲁姆教学目标分类学和 Q 矩阵理论为理论支 撑 ,以 属 性 掌 握 概 率 方 法 为 算 法 实 现 支
撑,结合教育评价的实施过程构建了基于学习测评数据的个性化评价模型。 该模型包括教学目标达成情况、知识点掌握
程度两个维度以及知识点掌握度、学习风险问题点、学习目标达成度、课程成绩四个方面。 其次,以江 苏 某 高 中 高 一 50
名学生的学习测评数据对个性化评价模型进行了数据检验 ,测评数据包含关于《解三角形》和《数列》的六个知识点。 最
后,在模型构建的基础上设计了个性化评价工具原型,并进行了 UAT 测试。 研究结果表明:所构建的模型能够对学习者
的学习结果进行个性化评价,帮助学生及时进行具有针对性的补救;相较于认知水平,教师更加关注学生的知识点掌握
程度,其中,学习风险问题点是师生最关心的个 性 化 评 价 数 据 ;学 生 的 认 知 水 平 和 知 识 点 的 掌 握 程 度 正 相 关 ,表 明 测 评
数据是学生对知识点内化的外显形式;工具原型在不同维度上的 UAT 测试平均评价得分为 8.834 ,表明该工具整体接受
度较高,可用性较好,为后期工具的技术实现奠定了基础。
[ 关键词 ] 测评数据; 个性化评价; 教学目标分类; Q 矩阵理论; 知识点掌握
[ 中图分类号 ] G434 [ 文献标志码 ] A
[ 作者简介 ] 牟智佳 (1987 — ) ,男,山东栖霞人。 副教授,博士,主要从事教育大数据与学习分析、信息技术与课程整合
等方面的研究。 E-mail :ambitionyt@163.com 。
和利用。 当人数、试题数及题型过多时,会因其计算时
一、研究背景
间长、工作负荷重导致错误情况的发生,影响评价结果
测量是评价的基础, 评价是对测量结果教学意义 的准确性和时效性。 美国 2016 国家教育技术计划《未
的阐述。在测量理论指导下,学习评价结果逐渐由笼统 来学习准备:重塑技术在教育中的角色》[2]和我国《教育
测验分数转向精准个性化诊断结果[1],以此来了解学习 信息化 2.0 行动计划》[3] 都强调,教育应依托大数据和
者认知结构与学习水平。然而,传统考试中教师多采用 人工智能技术,创新完善教育数据系统,促进个性化
人工计算的方法,对学习者成绩、班级平均分、排名变 学习和教育治理。 当前,数据驱动学习评价逐渐趋向
化等进行统计分析, 往往忽略试卷内容和试题作答情 智能化,针对基础教育考试数据收集不全面 、分析浅
况等细节信息,造成数据信息不能得到有效记录、挖掘 层次、仅以分数论优劣的现状,本研究基于学生学习
基 金 项 目 :2018 年 度 教 育 部 人 文 社 会 科 学 研 究 青 年 基 金 项 目 “ 基 于 测 评 大 数 据 的 学 习 预 警 与 干 预 研 究 ” ( 项 目 编 号 :
18YJC880068 );江 苏 省 社 会 科 学 基 金 青 年 项 目 “基 于 教 育 大 数 据 的 学 习 风 险 预 警 与 干 预 研 究 ”(项 目 编 号 :18JYC006 )
96
2019 年第 8 期(总第 316 期)
97
电化教育研究
98
2019 年第 8 期(总第 316 期)
扩大题目类型的适用范围。 步骤五:最后,学 生 i 对 属 性 k 的 掌 握 概 率 等 于
(二)基于 Q 矩阵的评价结果理论计算 涉及属性 k 且学生 i 答 对 的 所 有 项 目 的 答 对 概 率 之
在上述研究结果的基础上,我们基于 Q 矩阵的属 和除以涉及属性 k 的所有项目的答对概率之和。 至
性掌握概率模型来实现对学习评价结果的计算、认识 此,可得到所有学生对这次考试涉及的所有属性的掌
水平层级的诊断,该模型的可行性、有效性均已得到 握概率估计值:
验证,满足教师从明晰数据到有效信息转化过程的现 m
实需求。 其计算步骤如下:
Σmin(r ij ,qjk )×gij m
pik= j = 1
m
,x∧y=min (x,y),若 Σqik
步骤一:假设在某个测试中,共有 m 个试题,n 个 j = 1
... 通过以上方法可以准确计算出每个学生对教学
r21 r22 r2m
Rn×m = ,rij∈{0,1} 目标及各知识点的掌握情况,但教师和学生缺乏的往
... ... ... ...
往不是数据而是有效信息,基于此问题,我们采用数
rn1 rn2 ... rnm
据可视化技术呈现结果信息,帮助教师和学生快速掌
步骤二:假设所有试 题 只 涉 及 l 个 属 性 ,通 过 对 握测评结果,提升教育决策的科学性 [18]。 考虑到认知
试题进行分析,若 试 题 涉 及 该 属 性 则 记 为 1,不 涉 及 评价结果的二维性,本研究选取了可将二维数据外显
则记为 0。 由此组成一个描述测试试题与所测属性间 的数据可视化图形来对测评结果进行可视化呈现。 其
关系的 Q 矩阵: 中,我们用三维柱形图表示学生对教学目标各个属性
q11 q12 ... q1l 的达成情况,可以帮助师生明晰学生擅长或生疏的学
q21 q22 ... q2l 习领域,并针对此因材施教,实现个性化评价的教学
Qm×l= ,qjk∈{0,1} 价值; 用雷达图表示学生不同考试的测评结果数据,
... ... ... ...
qm1 qm2 ... qml 以此观察知识点掌握情况的动态变化过程;用网络图
表示相关知识点的影响关系和单个知识点的掌握程
步骤三:根据以上得到的 Q 矩阵和 R 矩阵,利用 度,可以直观发现学习困难的根本原因及学习成绩不
矩阵乘法,可以得到每个学生在各个属性上的答对个 理想的问题知识点,对存在学习风险的知识点及时进
数 Nik ,即学生 i 对涉及属性 k 的项目的答对个数: 行有针对性的补救。
r11 r12 ... r1m q11 q12 ... q1l (四)基于测评数据的个性化评价模型生成
99
电化教育研究
图1 基于学习测评数据的个性化评价模型
表1 基于试题和二维目标属性的关联 Q 矩阵
目标 记忆事 理解事 应用事 评价事 记忆概 理解概 应用概 分析概 评价概 应用程 分析程 评价程
实性知 实性知 实性知 实性知 念性知 念性知 念性知 念性知 念性知 序性知 序性知 序性知
试题 识 识 识 识 识 识 识 识 识 识 识 识
1 0 0 0 0 0 1 0 0 0 0 0 0
2 0 0 0 0 0 1 0 0 0 0 0 0
3 0 1 0 0 0 0 0 0 0 0 0 0
… … … … … … … … … … … … …
49 0 0 0 0 0 0 1 0 0 0 1 0
50 0 0 0 0 0 1 0 0 0 0 0 0
51 0 0 0 0 0 0 0 1 0 0 0 0
52 0 0 0 0 0 0 0 0 1 1 0 0
100
2019 年第 8 期(总第 316 期)
表2 学生二维目标掌握概率估计值
目标 记忆事 理解事 应用事 评价事 记忆概 理解概 应用概 分析概 评价概 应用程 分析程 评价程
实性知 实性知 实性知 实性知 念性知 念性知 念性知 念性知 念性知 序性知 序性知 序性知
学生 识 识 识 识 识 识 识 识 识 识 识 识
1 1.00 0.74 1.00 1.00 1.00 1.00 0.87 1.00 0.47 0.91 0.65 0.50
2 1.00 0.69 1.00 1.00 0.80 0.93 0.84 0.64 0.27 0.75 0.60 0.73
3 1.00 0.87 0.78 1.00 0.60 0.80 0.58 0.56 0 0.51 0.65 0.46
… … … … … … … … … … … … …
47 0.87 1.00 1.00 1.00 1.00 0.93 0.77 0.78 0.50 0.71 0.70 0
48 1.00 0.69 0.56 1.00 1.00 0.66 0.68 0.75 0.17 0.63 0.14 0
49 0.82 0.73 0.73 1.00 1.00 0.92 0.82 0.92 0.48 0.81 0.65 0.70
50 1.00 0.65 0.70 1.00 1.00 0.72 0.69 0.50 0.44 0.66 0.23 0.23
确的所有试题的答对概率之和与涉及属性 k 的所有
试 题 的 答 对 概 率 之 和 的 比 值 , 即 pik =
m
Σmin(r
j = 1
ij ,qjk )×gij
m
,x∧y=min (x ,y)。
Σq
j = 1
jk ×gij
在得到每位学生在知识目标、 认知过程目标以及
知识与认知过程二维目标的达成度的基础上, 进一步
从班级的平均情况和学生的个体情况两个方面对其进
行统计分析。 分析结果表明:在班级平均情况方面,整 (b )
个班级对布鲁姆教学目标的平均达成情况随层级的升 图2 教育目标达成度、相同分数学生教育目标达成度对比
高而降低;学生普遍对“记忆”“事实性知识”掌握最好, (三)知识点掌握程度的个性化评价与分析
随着认知过程层次的升高,知识越来越抽象,学生的目 通过上述计算, 我们得到该班级 50 名学生在所
标达成度依次降低,详情如图 2(a)所示。 在学生个体 有知识点上的掌握概率估计值,具体见表 3。 从班级
情况方面,将 A 学生对布鲁姆教育目标的达成情况与 的平均情况和学生的个体情况两个方面对知识点掌
班级平均情况进行对比, 发现该学生高层次认知能力 握计算结果进行统计分析,结果如下:(1)通过对班级
低于班级平均水平,应该加强对事实性知识的学习,逐 知识点平均掌握程度的分析,可以帮助教师找准薄弱
步提高自己的高层次认知水平。 此外,将不同分数段具 知识点, 对班级普遍掌握较差的知识点进行统一讲
有相同分数的学生进行对比, 发现分数相同的学生认 解。 如图 3 所示,学生整体对知识点掌握情况由高到
知分布也存在差异,如图 2(b)所示。 因此,生生帮扶并 低依次是余弦定理 > 正弦定理 > 等差数列 > 等比数列 >
101
电化教育研究
102
2019 年第 8 期(总第 316 期)
[参考文献 ]
[1] SHUTE V J ,ZAPATA-RIVERA D. Educational assessment using intelligent systems [R].Tallahassee : ETS Research Report Series ,
2008 :5-6.
[2] U.S. Department of Education ,Office of Educational Technology.Future ready learning :reimagining the role of technology in education
[R].Washington ,D.C. :American Institutes for Research ,2016.
[3] 中华人民共和国教育部 . 教育部关于印发《教育信息化 2.0 行动计划》的通知 [DB/OL]. (2018-04-18 )[2018-07-26].http ://www.moe.
gov.cn/srcsite/A16/s3342/201804/t20180425_334188.html.
[4] 檀慧玲,李文燕,万兴睿 . 国际教育评价项目合作问题解决能力测评:指标框 架 、评 价 标 准 及 技 术 分 析 [J]. 电 化 教 育 研 究 ,2018 ,39
(9 ):123-128.
[5] YANKOVSKAYA A,DEMENTYEV Y ,YAMSHANOV A.Application of learning and testing intelligent system with cognitive
component based on mixed diagnostics tests[J]. Procedia-social and behavioral sciences ,2015 ,206 :254-261.
[6] 牟智佳 . 电子书包中基于教育大数据的个性化学习评价模型与系统设计 [J]. 远程教育杂志, 2014 (5 ):90-96.
[7] HLAOUI Y B ,HAJJEJ F ,AYED L J B.Learning analytics for the development of adapted e -assessment workflow system :
CLOUD_AWAS[J].Computer applications in engineering education ,2016 ,24 (6 ):951-966.
103
电化教育研究
[Abstract] A large number of evaluation exercises are a kind of normal evaluation activities in basic
education. The various evaluation data generated by learners provide a data basis for analyzing their level
of knowledge acquisition and achievement of goals. Firstly, the paper analyzes the personalized evaluation
and the theory of educational measurement, and couples the research problems with the advantages and
disadvantages of theories. Then, a personalized evaluation model based on learning evaluation data is
established, which is supported by Bloom's teaching target taxonomy and Q matrix theory, and attribute
mastery probability method as well. The model includes two dimensions of the achievement of teaching
objectives, the degree of knowledge point mastery, and four aspects of knowledge points, learning risk
points, the achievement of learning goals, and course achievements. Secondly, the personalized evaluation
model is tested with the learning evaluation data of 50 students in a senior high school in Jiangsu province.
The evaluation data contains six knowledge points about "Solution Triangle" and "Number Sequence".
Finally, based on the model construction, a prototype of personalized evaluation tool is designed and tested
by UAT. The research results show that the model can make personalized evaluation of learners' learning
results and help students to make targeted remedies in time. Compared with the cognitive level, teachers
(下转第 113 页)
104
2019 年第 8 期(总第 316 期)
(上接第 86 页)
significance for the development of personalized adaptive learning driven by data intelligence.
[Keywords] Educational Knowledge Graph; Conceptual Model; Knowledge Element; Pre -and -after
Relationship; Cognitive State; Learning Path
(上接第 104 页)
pay more attention to students' mastery of knowledge points. Among them, learning risk point is the
personalized evaluation data that teachers and students are most concerned about; students' cognitive level
is positively correlated with their mastery of knowledge points, indicating that the evaluation data is an
explicit form of students' internalization of knowledge points. The average evaluation score of UAT test of
the tool prototype in different dimensions is 8.834, indicating that the tool has a high overall acceptance
and good usability, which lays a foundation for future technical implementation of the tool.
[Keywords] Evaluation Data; Personalized Evaluation; Taxonomy of Educational Objectives; Q Matrix
Theory; Mastery of Knowledge Points
113