基于面部表情的学习困惑自动识别法
发布时间:2021-08-08 06:35
学习情绪是学习者模型的重要内容,如何识别学习者的学习情绪是下一代智能教辅系统的关键技术。困惑是最常见的学习情绪之一,及时识别并解决困惑有助于提高学习效果,然而困惑情绪内隐性较强,识别难度较大。本研究设计了一组基于在线测评的困惑诱导实验,提出了一种基于面部表情的学习困惑自动识别算法。研究人员通过设定不同难度的测试题诱导被试产生困惑情绪,同时利用摄像设备实时捕捉学习者的面部表情,提取面部重要特征点,进而利用机器学习算法进行困惑识别。在实验中,本研究使用逻辑回归、支持向量机、K近邻、决策树、随机森林和深度学习等机器学习算法建立学习困惑自动检测模型,并与被试自我报告确定的困惑标签进行对比。实验结果表明,多数分类算法能有效检测学生的学习困惑,随机森林模型的预测性能最佳,平均准确率为71.18%。本研究所提出的方法可为下一代智能教辅系统的学习者情绪建模提供技术支撑。
【文章来源】:开放教育研究. 2018,24(04)北大核心CSSCI
【文章页数】:8 页
【部分图文】:
学习困惑检测研究路线
图1学习困惑检测研究路线(一)数据收集1.实验流程本实验选取了某大学20名在校研究生进行英语测试,男女比例为1∶1;每位被试需完成30道英语测试题,试题来源于知名在线题库“组卷网”(ht-tps://www.zujuan.com/)。研究者从题库选择难、中等和容易三种难度的选择题,比例为1∶1∶1。被试人员英语水平分布为:通过大学生英语六级考试的40%,已通过四级考试的50%,未通过四级考试的10%。本次实验在实验室环境下进行(见图2),被试在电脑上进行试题作答,研究人员用另外一台电脑通过摄像头(型号:IntelNo.VF8010)实时采集被试面部表情。研究者采集学生解答每道题时的5张面部表情图片,共采集每个学生150张表情图片,整个实验共计采集3000张表情图片。图2实验室环境下收集学习困惑表情图片2.定义数据标签在基于面部表情识别情绪的相关研究中,国外同行通常根据研究对象的自我报告定义数据标签(Dursoetal.,2012;Whitehillelal.,2014)。因此,在测试完成后,被试需要再次浏览所有试题,确定解答每道试题时的学习困惑状态,并通过自我评价定义困惑标签。为了使被试对困惑标签的定义更客观,本研究仅使用两类学习困惑标签:困惑和不困惑。若被试对英语试题所表达的意思、选项答案、考察知识点等一或多个因素不了解,不知道如何选择则被视为困惑;反之,被试对该道英语试题意思及考察知识点完全清楚,几乎不需太多思考就能选定答案则定义为不困惑。(二)数据预处理1.数据清洗实验中,被试思考和解答试题时常会头部晃动,造成面部偏离图像的中央位置,摄像头不能正确捕捉面部特征点,因此,需要?
做归一化处理,即将数据统一映射到[0,1]区间内。归一化有很多优点,可以提升模型收敛的速度又能提高模型的精度。本文使用的是z-score标准化,也叫标准差标准化,即对原始数据的均值和标准差进行标准化。经过处理的数据符合标准正态分布,即均值为0,标准差为1,其转化函数为:x*=(x-μ)/σ。其中,x*为转化后的值,μ、σ分别为所有样本数据的均值和标准差。图3面部特征提取过程(三)自动检测模型架构本研究使用逻辑回归、支持向量机、K近邻、决策树、随机森林和深度前馈神经网络建立学习困惑自动检测分类模型。逻辑回归(LogisticRegression,简称LR)是最常见的分类方法之一,常用作预测建模等教育数据挖掘任务(宗阳等,2016)。二元逻辑回归是最简单的形式,即根据一或多个连续或离散自变量预测两个离散因变量的广义线性模型,本研究预测变量只有两个类别,因此使用二元逻辑回归。支持向量机(SupportVectorMachine,简称SVM)是一种具有坚实的统计理论基础的分类技术,可将数据映射到高维空间进行非线性分类。SVM应用于高维数据,可有效避免维度灾难问题,本研究采用的支持向量机核函数为高斯核。K近邻(K-NearestNeighbor,简称KNN)是一种基于度量实例间的相似性或距离的“惰性学习”算法,通过距离度量找出训练集中与其最靠近的K个训练样本,并使用“投票法”,选择K个样本中出现最多的类别作为预测结果。本研究K值设置为3,即通过最邻近的三个样本确定分类标签。决策树(DecisionTree,简称DT)是一种解释性很强的分类算法,模型可以通过由节点和
【参考文献】:
期刊论文
[1]人工智能2.0重塑学习的技术路径与实践探索——兼论智能教学系统的功能升级[J]. 陈凯泉,沙俊宏,何瑶,王晓芳. 远程教育杂志. 2017(05)
[2]基于学业成绩预测的教学干预研究[J]. 丁梦美,吴敏华,尤佳鑫,孙众. 中国远程教育. 2017(04)
[3]MOOCs学习行为与学习效果的逻辑回归分析[J]. 宗阳,孙洪涛,张亨国,郑勤华,陈丽. 中国远程教育. 2016(05)
[4]学业困惑:概念、研究范式及其与学习的关系[J]. 马惠霞,杨莹莹. 心理与行为研究. 2015(06)
[5]情感计算及其在人机交互设计中的应用[J]. 夏洪文. 中国电化教育. 2008(01)
本文编号:3329427
【文章来源】:开放教育研究. 2018,24(04)北大核心CSSCI
【文章页数】:8 页
【部分图文】:
学习困惑检测研究路线
图1学习困惑检测研究路线(一)数据收集1.实验流程本实验选取了某大学20名在校研究生进行英语测试,男女比例为1∶1;每位被试需完成30道英语测试题,试题来源于知名在线题库“组卷网”(ht-tps://www.zujuan.com/)。研究者从题库选择难、中等和容易三种难度的选择题,比例为1∶1∶1。被试人员英语水平分布为:通过大学生英语六级考试的40%,已通过四级考试的50%,未通过四级考试的10%。本次实验在实验室环境下进行(见图2),被试在电脑上进行试题作答,研究人员用另外一台电脑通过摄像头(型号:IntelNo.VF8010)实时采集被试面部表情。研究者采集学生解答每道题时的5张面部表情图片,共采集每个学生150张表情图片,整个实验共计采集3000张表情图片。图2实验室环境下收集学习困惑表情图片2.定义数据标签在基于面部表情识别情绪的相关研究中,国外同行通常根据研究对象的自我报告定义数据标签(Dursoetal.,2012;Whitehillelal.,2014)。因此,在测试完成后,被试需要再次浏览所有试题,确定解答每道试题时的学习困惑状态,并通过自我评价定义困惑标签。为了使被试对困惑标签的定义更客观,本研究仅使用两类学习困惑标签:困惑和不困惑。若被试对英语试题所表达的意思、选项答案、考察知识点等一或多个因素不了解,不知道如何选择则被视为困惑;反之,被试对该道英语试题意思及考察知识点完全清楚,几乎不需太多思考就能选定答案则定义为不困惑。(二)数据预处理1.数据清洗实验中,被试思考和解答试题时常会头部晃动,造成面部偏离图像的中央位置,摄像头不能正确捕捉面部特征点,因此,需要?
做归一化处理,即将数据统一映射到[0,1]区间内。归一化有很多优点,可以提升模型收敛的速度又能提高模型的精度。本文使用的是z-score标准化,也叫标准差标准化,即对原始数据的均值和标准差进行标准化。经过处理的数据符合标准正态分布,即均值为0,标准差为1,其转化函数为:x*=(x-μ)/σ。其中,x*为转化后的值,μ、σ分别为所有样本数据的均值和标准差。图3面部特征提取过程(三)自动检测模型架构本研究使用逻辑回归、支持向量机、K近邻、决策树、随机森林和深度前馈神经网络建立学习困惑自动检测分类模型。逻辑回归(LogisticRegression,简称LR)是最常见的分类方法之一,常用作预测建模等教育数据挖掘任务(宗阳等,2016)。二元逻辑回归是最简单的形式,即根据一或多个连续或离散自变量预测两个离散因变量的广义线性模型,本研究预测变量只有两个类别,因此使用二元逻辑回归。支持向量机(SupportVectorMachine,简称SVM)是一种具有坚实的统计理论基础的分类技术,可将数据映射到高维空间进行非线性分类。SVM应用于高维数据,可有效避免维度灾难问题,本研究采用的支持向量机核函数为高斯核。K近邻(K-NearestNeighbor,简称KNN)是一种基于度量实例间的相似性或距离的“惰性学习”算法,通过距离度量找出训练集中与其最靠近的K个训练样本,并使用“投票法”,选择K个样本中出现最多的类别作为预测结果。本研究K值设置为3,即通过最邻近的三个样本确定分类标签。决策树(DecisionTree,简称DT)是一种解释性很强的分类算法,模型可以通过由节点和
【参考文献】:
期刊论文
[1]人工智能2.0重塑学习的技术路径与实践探索——兼论智能教学系统的功能升级[J]. 陈凯泉,沙俊宏,何瑶,王晓芳. 远程教育杂志. 2017(05)
[2]基于学业成绩预测的教学干预研究[J]. 丁梦美,吴敏华,尤佳鑫,孙众. 中国远程教育. 2017(04)
[3]MOOCs学习行为与学习效果的逻辑回归分析[J]. 宗阳,孙洪涛,张亨国,郑勤华,陈丽. 中国远程教育. 2016(05)
[4]学业困惑:概念、研究范式及其与学习的关系[J]. 马惠霞,杨莹莹. 心理与行为研究. 2015(06)
[5]情感计算及其在人机交互设计中的应用[J]. 夏洪文. 中国电化教育. 2008(01)
本文编号:3329427
本文链接:https://www.wllwen.com/jiaoyulunwen/jiaoyujiaoxuefangfalunwen/3329427.html