Educational Data Mining is an emerging discipline, concerned with developing methods for exploring the unique and increasingly large-scale data that come from educational settings and using those methods to better understand students, and the settings which they learn in.
----- educationaldatamining.org
一、 什么是教育数据挖掘?
如同国际教育数据挖掘协会(IEDMS) 首页所展示所言。教育数据挖掘实际上就是基于计算机系统的学习系统,交互学习环境,模拟学习环境,现有学校学习系统等采集用户学习行为数据。在心理学和学习科学的理论知道下,利用计算机科学、数据挖掘等领域的知识,发现学生是如何学习。
二、教育数据有哪些特点?
- 一个重要的且独一无二的特点:教育数据是具有层次性的(hierarchical)。即按键层keystroke level)、问答层、会话层、学生层、课堂层、教师层、学校层,层层嵌套。对于现有的在线教育,层次分类可能有些许不同,但是数据的结构还是具有层次性的。
- 教育数据具有时间和序列属性,并且具有上下文背景。
- 时间属性包括学习的时间戳、学习时长等
- 序列表示学习中概念之间是如何相互联系的,以及如何对练习及教学进行排序
- 上下文对解释结果和判断模型可不可行非常重要
三、教育数据挖掘的目标是什么?
- 通过创建包含学生知识,动机,元认知和态度等详细信息的学生模型来预测学生未来的学习行为
- 发现或改进 表征要学习的内容和最佳教学序列的领域模型(domain models)
- 研究学习软件可以提供的各种教学支持的效果
- 通过构建包含 学生模型,领域和软件教学法的计算模型,推进关于学习和学习者科学知识的提升
四、教育数据挖掘采用什么技术?
1. 预测(Prediction)
需要建立一个可以由一些数据的组合推断出另外一个数据的模型。比如侦测是不是在戏耍系统、非期望任务行为、已有技能但不正确回答问题等等。预测模型已经被应用在理解在线教育的行为上,比如通过论坛表现和参加测试等等来预测哪些学生会学习失败。以及预测学生们的教育成果。
2. 聚类(Clustering)
通过一些共有的特征将学生分成几个类别,比如通过学生们的学习表现和交互模式,分组推荐学习动作和学习资源。
3. 关联挖掘(Relationship mining )
发掘数据集中各个变量之间的联系,并将其编码形成规则,以便于之后使用。例如,关联分析可以识别在线购物中产品之间的关系(哪些商品会经常被一起购买等,这个经典的例子是《啤酒与尿布》,有兴趣的小伙伴可以了解了解) 。
关联规则挖掘(Association rule mining)
运用于教育领域可以发现学生们共现的错误,根据学生特性和内容的关联推荐相关的可能感兴趣的内容,或者改善教学方法。
序列模式挖掘(Sequential pattern mining)
可以捕捉到连续事件之间的联系,从而建立规则。可以用来检测事件,比如由于题目或者知识点很难的时候,学习时长、学习论坛和求助行为等一系列事件发生的内在联系。
关联挖掘在教育中的关键应用有:发现学生表现和课程序列之间的关联,以及发现哪些教学策略可以带来更有效或更有效的学习。后一个领域称为教学分析,旨在帮助研究人员建立自动化系统,通过挖掘教育系统的使用数据来模拟教师的工作。
4. 决策支持(Distillation for human judgment)
描述数据,帮助人们迅速识别数据的特征。比如学生观的学习动作、表现、学生之间的合作等(和数据可视化分析有点类似)。
5. 模型发现(Discovery with models)
通过已经建立的模型(比如前面的预测、聚类、关联挖掘等)和人类已有的知识,将这些模型及经验知识作为一个组件,建立更加完备和复杂的综合模型(搭积木一样把模型组件搭起来),挖掘更加深层的信息。
五、运用上面的技术,能够回答我们什么问题?
- 对某个特定学生,什么样的主题序列是最有效的
- 什么学习行为能与更好的学习相关联(比如更高的课程得分
- 什么学习行为能够表明 满意度、参与度、学习进程等等?
- 在线学习环境的什么特征能够带来更好的学习效果?
- 哪些因子能够预测学生的成功(表征习得等等)?