大数据视角分析学习变革
本文关键词:分析学
内容摘要:“数据驱动学校,分析变革教育”的大数据时代已经来临,利用教育数据挖掘技术和学习分析技术,构建教育领域相关模型,探索教育变量之间的相关关系,为教育教学决策提供有效支持将成为未来教育的发展趋势。“大数据”的出现,将掀起人类教与学的又一次变革。2012年,美国国家教育部发布了《通过教育数据挖掘和学习分析促进教与学》报告,对美国国内大数据教育应用领域和案例,以及应用实施所面临的挑战进行了详细的介绍。借鉴此报告,我们认为未来我国教育领域的大数据研究和应用,应加强国家和地方对相关的研究和应用在技术层面、管理体制层面以及法律制度层面的支持,按需合理规划具体研究和应用,整合现有资源,发挥后进优势,借助“大数据”实现真正意义上的个性化学习,进而实现教育公平。
关键词:大数据;教育数据挖掘;学习分析
作者简介:
作者简介:徐鹏,东北师范大学在读博士研究生,工程师,东北师范大学信息化管理与规划办公室,研究方向:教师教育技术、大数据教育应用;王以宁,东北师范大学传媒科学学院教授,博士生导师,研究方向:教师教育技术;刘艳华,吉林大学公共外语教育学院讲师,研究方向:网络教育、数字化教学设计,吉林 长春 130012;张海,东北师范大学传媒科学学院副教授,博士生导师,研究方向:教师教育技术,吉林 长春 130024
内容提要:“数据驱动学校,分析变革教育”的大数据时代已经来临,利用教育数据挖掘技术和学习分析技术,构建教育领域相关模型,探索教育变量之间的相关关系,为教育教学决策提供有效支持将成为未来教育的发展趋势。“大数据”的出现,将掀起人类教与学的又一次变革。2012年,美国国家教育部发布了《通过教育数据挖掘和学习分析促进教与学》报告,对美国国内大数据教育应用领域和案例,以及应用实施所面临的挑战进行了详细的介绍。借鉴此报告,我们认为未来我国教育领域的大数据研究和应用,应加强国家和地方对相关的研究和应用在技术层面、管理体制层面以及法律制度层面的支持,按需合理规划具体研究和应用,整合现有资源,发挥后进优势,借助“大数据”实现真正意义上的个性化学习,进而实现教育公平。
关 键 词:大数据 教育数据挖掘 学习分析
一、报告发布背景简介
近年来,随着互联网的飞速发展,人们越来越多的行为在网络中发生,这直接导致互联网中人类行为相关数据呈爆炸式增长,人类在不知不觉中已经进入了一个“大数据”时代。联合国在2012年发布的大数据白皮书"Big Data for Development:Challenges & Opportunities"中指出,大数据时代已经到来,大数据的出现将会对社会各个领域产生深刻影响[1]。为此,世界各国都在此领域投入大量人力物力来支持“大数据”相关研究和应用。美国作为世界科技强国,在2012年3月29日正式启动"Big Data Research and Development Initiative"计划,提出“通过收集、处理庞大而复杂的数据信息,从中获得知识和洞见,提升能力,加快科学、工程领域的创新步伐,强化美国国土安全,转变教育和学习模式”,正式将“大数据”提高到国家战略层面,美国政府为该计划投入了2亿美元[2]。2013年2月6日,美国国家科学基金会(National Science Foundation)宣布将额外投入1万美元,以激励社会及人文科学中的“大数据”研究的发展。另外,国际著名学术期刊Nature和Science分别在2008年和2011年推出大数据相关专刊,由此可见,“大数据”已经得到了世界各国学术界、工业界和政府机构的高度重视。
在教育领域,耶鲁大学、哈佛大学、斯坦福大学等世界知名高校也启动了教育大数据相关研究计划;另外,美国学校管理者协会(AASA)携手学校网络联合会(COSN),以及全球性的信息技术研究和咨询公司Gartner共同实施了一个名为"Closing the Gap:Turning Data into Action"的项目,旨在促进学校对学生信息系统和学习管理系统中大数据的使用。为了更好地促进美国国内“大数据”教育应用,为美国高等院校及K-12学校在“大数据”教育应用方面提供有效指导,美国教育部(U.S. Department of Education)在2012年10月发布了《通过教育数据挖掘和学习分析促进教与学》(Enhancing Teaching and Learning through Educational Data Mining and Learning Analytics)报告(以下简称《报告》)。《报告》内容主要包括以下五个方面:个性化学习解读;教育数据挖掘和学习分析解读;自适应学习系统中大数据应用介绍;美国教育数据挖掘和学习分析应用案例介绍;美国的大数据教育应用挑战和实施建议。《报告》内容主要来源于以下三个方面:对公开发表或未公开发表的教育数据挖掘和学习分析相关文献的综述;对教育软件和学习管理系统开发公司中15位数据挖掘和分析方面专家的采访;8位数据挖掘和学习分析领域学术专家讨论的总结[3]。
二、核心概念界定
(一)教育大数据
“大数据”这一概念对于我们来说已不陌生,维基百科上给出的大数据定义是:数据量规模巨大到无法通过目前主流软件工具获取、管理、处理、整理成为帮助企业经营决策,达成更积极目的的信息[4]。
国际数据公司(IDC)认为,大数据是符合4V特征的数据集,即海量的数据规模(Volume)、快速的数据流转和动态的数据体系(Velocity)、多样的数据类型(Variety)、巨大的数据价值(Value)[5]。而《报告》则引用了国际著名的咨询公司麦肯锡(Mckinsey)在2011年对大数据的定义,认为大数据是指数据量极大,以至于无法使用常规数据软件进行获取、存储、管理和分析的数据,“大数据”具有数据量大、数据多样和数据产生速度快三大特征[6]。教育领域中的大数据有广义和狭义之分,广义的教育大数据泛指所有来源于日常教育活动中人类的行为数据,它具有层级性、时序性和情境性的特征;而狭义的教育大数据是指学习者行为数据,它主要来源于学生管理系统、在线学习平台和课程管理平台等。
(二)教育数据挖掘和学习分析
通过对教育大数据的获取、存储、管理和分析,我们可以构建学习者学习行为相关模型,分析学习者已有学习行为,并对学习者的未来学习趋势进行科学预测。《报告》指出,目前教育领域中大数据的应用主要有教育数据挖掘和学习分析两大方向,两个研究方向虽然同源,却在研究目的、研究对象和研究方法等方面截然不同,具体比较情况如表1所示。
1.教育数据挖掘
教育数据挖掘是综合运用数学统计、机器学习和数据挖掘的技术和方法,对教育大数据进行处理和分析,通过数据建模,发现学习者学习结果与学习内容、学习资源和教学行为等变量的相关关系,来预测学习者未来的学习趋势。《报告》通过对教育数据挖掘领域专家进行访谈,列出了教育数据挖掘的四个研究目标[7]:(1)通过整合学习者知识、动机、元认知和态度等详细信息进行学习者模型的构建,预测学习者未来学习发展趋势。(2)探索和改进包含最佳教学内容和教学顺序的领域模型。(3)研究各种学习软件所提供的教学支持的有效性。(4)通过构建包含学习者模型、领域模型和教育软件教学策略的数据计算模型,促进学习者有效学习的发生。
《报告》指出,为了达到以上四个研究目标,研究者主要采用以下五类技术方法:(1)预测。建立一个能够从整合多个预测变量推断单一被预测变量的模式,例如,研究者通过在线学习环境中学习者参与在线讨论的情况、测试情况等,预测学习者在该门课程的学习中是否有失败的风险。(2)聚类。根据数据特性,将一个完整的数据集分成不同的子集,例如,研究者根据学习者在在线学习环境中学习困难、交互模式等将学习者分成不同的群组,进而为不同的群组提供合适的学习资源和组织合适的学习活动。(3)关系挖掘。探索数据集中各变量之间的相关关系,并将相关关系作为一条规则进行编码,例如,研究者利用关系挖掘,探索在线学习环境中学习者学习活动和学习成绩的相关关系,进而用于改进学习内容呈现方式和序列,以及在线教学方法。(4)人类判断过程简化。用一种便于人类理解的方式描述数据,以便人们能够快速地判断和区分数据特征,该方法主要以可视化数据分析技术为主,用以改善机器学习模型。(5)模型构建。通过对数据集的聚类、相关关系挖掘等过程,构建供未来分析的有效现象解释模型。
2.学习分析
学习分析是近年来大数据在教育领域较为典型的应用,在国际上有专门针对学习分析研究和应用的国际会议“学习分析技术与知识国际会议”,目前已举办两届。在首届会议上将学习分析定义为“测量、收集、分析和报告有关学习者及其学习情景的数据集,以理解和优化学习及其发生情景”[8]。新媒体联盟(New Media Consortium)将学习分析定义为:利用松散耦合的数据收集工具和分析技术,研究分析学习者学习参与、学习表现和学习过程的相关数据,进而对课程、教学和评价进行实时修正[9]。我国学者顾小清认为,学习分析是围绕与学习者学习信息相关的数据,运用不同的分析方法和数据模型来解释这些数据,根据解释的结果来探究学习者的学习过程和情景,发现学习规律;或者根据数据阐释学习者的学习表现,为其提供相应的反馈从而促进更加有效的学习[10]。《报告》中认为,学习分析是综合运用信息科学、社会学、计算机科学、心理学和学习科学的理论和方法,通过对广义教育大数据的处理和分析,利用已知模型和方法去解释影响学习者学习重大问题,评估学习者学习行为,并为学习者提供人为的适应性反馈。例如,教师和学校根据学习分析的结果,调整教学内容、对有学习失败风险的学生进行干预等。学习分析一般包括数据采集、数据存储、数据分析、数据表示和应用服务五个环节[11]。
三、报告核心内容解读
(一)自适应学习系统中教育大数据应用
在线学习系统中包含大量的细粒度的学习者学习行为相关数据,例如,学习日志、学习路径、学习成果数据、课程数据、学习管理数据等,研究者利用教育数据挖掘和学习分析技术对数据进行采集、存储和分析,为包括学校管理者、教师和学生在内的各级各类人员提供相应的反馈,以帮助其改善学校管理、教学和学习。《报告》为了让业内对大数据教育应用有一个系统完整的认识,以教育大数据在自适应学习系统中的应用为例进行了详细的说明[12]。
该自适应学习系统包含六大模块:(1)内容传递模块。管理、维护、传递个性化的学习内容与评价给学习者,以支持学习者的学习行为。(2)学习者数据库。存储学习者在学习系统中的时间戳标记的学习者输入和学习行为数据。(3)预测模块。整合系统外部学习者信息系统中的数据和系统内部学习者学习行为数据,通过对数据的处理和分析,对学习者未来的学习行为和结果进行预测。(4)显示模块。将预测模块中的运行结果以可视化的方式显示给各类使用者。(5)自适应模块。根据预测模块的运行结果,触发内容传递模块,再根据学习者的学习水平和兴趣,推送合适的学习内容给学习者。(6)干预模块。允许教师、教学管理者和系统开发人员根据预测模块的运行结果,对自适应系统实施人为干预。
另外,自适应学习系统中除了这六大模块以外,还包括作为系统重要外部数据来源的学校、地区和机构的学生信息系统(SIS),该系统中存储着学习者相对稳定的个人基本信息数据。
基于大数据的自适应学习系统运行流程图如图1所示。第一步,学习者生成学习行为数据,经过内容传递模块,数据将被标记上时间戳;第二步,数据按照预先定义的结构存入学习者数据库;第三步,预测模块从学习者数据库和学生信息系统中采集数据,根据不同的分析目的,调用不同的分析工具和模型对数据进行分析;第四步,自适应模块根据预测模块中数据挖掘和分析的结果,通过内容传递模块为学习者提供合适的学习指导和学习策略;第五步,预测模块中数据挖掘和分析的结果同时被传递给显示模块,供教师和教学管理者使用;最后,教师和教学管理者根据分析结果,通过干预模块对系统进行人为干预。
图1 基于大数据的自适应学习系统组成及运行流程
(二)教育数据挖掘和学习分析典型应用
《报告》通过对基于教育大数据的自适应学习系统的组成和运行流程的个案描述,使业内对于大数据的教育应用有了一个整体的认识,属于纵向描述;接下来,《报告》对教育数据挖掘和学习分析的应用领域作了详细描述,使业内对大数据的教育应用有了一个更加具体的认识,属于横向描述。《报告》中有关教育数据挖掘和学习分析应用领域的内容主要来源于对领域内公开发表和未公开发表文献的综述,以及对领域专家的访谈。
教育数据挖掘和学习分析应用领域主要包括:学习者的知识、行为和经历建模;学习者建档;领域知识建模;趋势分析。详细应用领域情况如表2所示。
1.学习者知识建模
研究者通过采集学习者与在线学习系统的交互数据,包括学习者系统应答正确率、回答问题花费时间、请求帮助的数量和性质,以及错误应答的重复率等,这部分数据可以是课程层面的、学习单元层面的或知识点层面的。通过数据挖掘和分析,构建学习者知识模型,然后通过自动或人工反馈,为学习者在合适的时间,选择合适的方式,提供合适的学习内容。例如,Onsophic公司的在线学习平台就是通过收集平台中学习者每一个知识点学习(例如二次方程)的详细数据,通过数据挖掘和分析,建立学习知识模型,为学习者提供详细的学习反馈和建议。
2.学习者行为建模
研究者通过采集学习者在网络学习系统中花费的学习时间、学习者完成课程学习情况、学习者在课堂或学校情境中学习行为变化情况、学习者线上或线下考试成绩等数据,探索学习者学习行为与学习者学习结果的相关关系,最终构建学习者学习行为模型。例如,麦克费登(Macfayden)和道森(Dawson)通过跟踪和采集Blackboard在线学习平台上学习者学习行为相关数据,构建学习者行为模型,该模型被用于预测平台中学习者的学习失败可能。经过实证研究,该模型的预测正确率可以达到80%以上。
3.学习者经历建模
研究者通过采集学习者的学习满意度调查问卷或量表数据,以及其在后续单元或课程学习中的选择、行为、表现和留存率数据,构建学习者体验模型,利用该模型对在线学习系统中的课程和功能进行评估。例如,可汗学院(Kaplan Inc)通过构建学习者体验模型,对其线上课程进行评估,进行线上课程的再设计,改变课程学习顺序,大大提高了教师的教学效率和学习者的学习成绩。
4.学习者建档
研究者采集在线学习系统中学习者相关数据以及线下学习者基本信息数据,通过数据挖掘和机器学习算法,构建学习者个人学习档案,分析学习者的学习特征,对具有相同学习特征的学习者进行聚类和分组,最终为不同类型的学习者提供个性化的学习环境,促进学习者有效学习的发生。例如,卡丹(Kardan)和克纳蒂(Conati)利用数据挖掘技术对学习者与在线学习平台的交互日志进行分析,确定不同学习者的学习类型和交互特点,构建学习者的学习档案。该研究结果主要用于对新学习者进行分类,并提供合适的学习支持和交互支持。
5.领域知识建模
研究者通过对教育大数据的挖掘和学习分析,对现有领域知识模型进行重构,探索课程、学习单元和知识点的学习内容组织方式与学习者学习结果之间的相关关系。例如,,马丁(Martin)等人采集、处理学习者相关数据,构建学习者的学习曲线,并通过对大量学习者学习曲线数据的分析,对现有领域知识模型进行重构。
6.学习组件分析和教学策略分析
研究者通过对学习者在在线学习系统中的学习相关数据进行采集和分析,探索在线学习系统中学习组件的功能、在线教学策略与学习者学习结果的相关关系,进而实现对在线学习系统的评估。例如,里特(Ritter)等人通过对一个名为"Cognitive Tour"的数学教学智能导学系统中数据的挖掘和分析,为该系统提供了长达15年的动态、细粒度的系统评价,优化了系统的组成模块和线上教学策略。
7.趋势分析
研究中通过对大量学习者(2000人以上)一段时间内学习相关数据的采集和分析,探索学习者在这一阶段学习过程中的学习结果改变,发现学习者当前学习行为和未来学习结果的相关关系。并利用已建立的相关关系,依据新学习者的当前学习行为,预测其未来的学习趋势和结果。例如,加州高等教育协会为州内高等教育机构提供了一个在线趋势分析工具,该工具允许用户检索加州高等教育数据库,自定义检索条件,生成个性化的教育趋势预测结果。
8.自适应学习系统和个性化学习
这部分应用属于教育数据挖掘和学习分析的高级应用,是教育大数据相关研究的终极目标,通过对教育大数据的采集、处理和分析,最终实现学习者自适应和个性化学习环境的构建。
相关文章
本文编号:910880
本文链接:https://www.wllwen.com/wenshubaike/dxkc/910880.html