面向智慧教育的课堂教学交互活动视频分析
发布时间:2021-08-24 06:25
信息技术的发展深刻影响社会的方方面面,具体在教育领域,信息技术从最初的辅助作用发展为使教育信息化智能化,进而引发教育模式的改变,智慧教育便由此建立起来。而通信技术以及互联网的发展使得网络视频数量大大增加,也带来了海量的课堂教学视频,而现在对教学,教师的评价评优工作也大量依托于教学视频,大大减少了时间和空间成本。智慧教育的发展也带来了新的教学模式,近年来对于诸如翻转课堂的启发式教育研究十分火热,而就目前的教育形势和中国国情来说传统的讲授模式还是课堂教育的主体。本文着眼于本科生教育,针对本科生的教育教学中的交互活动设计了 一套基于视频数据的课堂教学交互活动信息追踪方法,具有重要的研究意义和实用性。对于本科生教学,一般形式包含普通讲授,研讨课和实验课。普通讲授的交互活动主要为教师与学生的问答环节,针对此环节设计了一种2DPCA+PCA+SVM的人脸识别方法进行交互主体的识别,为了提高识别的精度在其基础上引入全局竞争和随机吸引的概念泛化了和声搜索算法在复杂的多极值非线性支持向量机模型中进行参数寻优的能力。同时,对于普通讲授方式的交互内容进行语音识别,并通过语音信息进一步提高交互主体的识别效果。...
【文章来源】:北京化工大学北京市 211工程院校 教育部直属院校
【文章页数】:72 页
【学位级别】:硕士
【部分图文】:
图2.1语音识别流程示意图??Figure?2.1?schematic?diagram?of?classical?speech?recognition?process??
第二章理论基础??损失添加一正则化项来实现结构风险表示,通过正则化项的约束防止过学习的发??生。??假设样本数为n,最小结构风险关系模型如下图所示。??〃欠拟合|?|过拟合??\?i??—风险边界—??i?/??\\?丨?置信风险??经验风险???1?1?1????hi?hk?hn?VC?维??图2.2最小结构风险关系模型??Figure.2.2?Minimum?structural?risk?relationship?model??一般在机器学习过程中通过平衡经验风险与置信风险来调整模型,减少过拟??合与欠拟合的可能,同时将该思想应用于支持向量机,通过最大化分类边界获得??最小的VC维,从而降低学习系统的复杂性,进而实现结构风险最小化。??支持向量机(supportvectormachines,SVM)是一种二分类模型,它的基本??模型是定义在特征空间上不同于感知机的间隔最大线性分类器;SVM通过核函??数的使用使之处理非线性问题。SVM的学习策略就是间隔最大化,其等价于一??个求解凸二次规划的问题。基本思想是通过对学习样本进行非线性映射,将样本??映射到高维空间中,然后在高维空间中求取几何间隔最大的分离超平面,并利用??核函数实现内积运算,这样就使得在维数增加的情况下,计算复杂度却没有增加。??假设有训练样本{xyyj.yftl,/=1,?2,3,...,y?,X,为向量机输入,n为??样本数,y,.输出的1和-1代表正常和异常。SVM的目标就是寻求一个最优分类??超平面使》^?+?6?=?0,则满足??7;.(?wx.?+?Z?)?-?1?>?0???(2-17)??的训练样本成为支持
第二章理论基础??而当下最为流行的模型,无疑就是长短期记忆神经网络(LSTM)与卷积神??经网络(CNN)?了。声音从本质上讲可以看成一组连续的信号,而LSTM本身??能够很好地处理这类时序问题。LSTM的突出贡献就是解决了循环神经网络??(RNN)的长期依赖问题。其主要结构如下:?????????T?t?t????—-j—??A?.Uifil?A?+??h??J『??@?(x^)??图2.3长短期记忆神经网络模型??Figure.2.3?long?and?short?term?memory?neural?network?model??其通过细胞状态保证在链式结构下信息传输的畅通,通过遗忘门,输入门和输出??门决定信息的丢弃与添加。这样的结构使其成为时序问题中的经典模型。??一般来说卷积神经网络被广泛应用于计算机视觉,但时下很多主流的语音识??别系统都使用其进行声学建模,例如科大讯飞的语音识别框架。卷积神经网络可??以提供在时间和空间上的平移不变性卷积,在声学建模中可以利用卷积的不变性??来克服语音信号本身的多样性,从这个角度来看,则可以认为是将整个语音信号??分析得到的时频谱当作一张图像一样来处理。并且与LSTM相比CNN更容易实??现大规模并行化运算,所以近年来卷积神经网络成为声学建模的新宠。??传统的语音识别使用语音模型,词典,语言模型进行实现,它们对于整个语??音识别系统都是分开优化的,因此这两个模型优化的损失函数不是相同的,但是??语音识别本质上是一个序列识别问题,如果模型中的所有组件都能够联合优化,??很可能会获取更好的识别准确度,由此研究者们提出了端到端的语音识别。对于??端到端的
【参考文献】:
期刊论文
[1]用于课堂教学评估的教师肢体动作检测[J]. 闫晓炜,张朝晖,赵小燕,贾鹂宇. 中国教育信息化. 2019(16)
[2]课堂环境双模态情感评价系统设计与效果分析[J]. 郭雯雯,杨凤梅. 教学研究. 2019(03)
[3]智慧教育:价值引导与实践操作的融合[J]. 刘伟. 电化教育研究. 2017(06)
[4]增强现实(AR)技术的教育应用综述[J]. 蔡苏,王沛文,杨阳,刘恩睿. 远程教育杂志. 2016(05)
[5]基于PCA及机器学习的人脸识别应用研究[J]. 沈萍. 计算机教育. 2016(06)
[6]全局竞争和声搜索算法[J]. 夏红刚,欧阳海滨,高立群,孔祥勇. 控制与决策. 2016(02)
[7]智慧教育的三重境界:从环境、模式到体制[J]. 黄荣怀. 现代远程教育研究. 2014(06)
[8]国际智慧教育发展战略及其对我国的启示[J]. 陈耀华,杨现民. 现代教育技术. 2014(10)
[9]国内语音识别研究综述[J]. 于俊婷,刘伍颖,易绵竹,李雪,李娜. 计算机光盘软件与应用. 2014(10)
[10]智慧教育:教育信息化的新境界[J]. 祝智庭,贺斌. 电化教育研究. 2012(12)
硕士论文
[1]教育学视域下的智慧教育研究[D]. 刘伟.华中师范大学 2018
本文编号:3359462
【文章来源】:北京化工大学北京市 211工程院校 教育部直属院校
【文章页数】:72 页
【学位级别】:硕士
【部分图文】:
图2.1语音识别流程示意图??Figure?2.1?schematic?diagram?of?classical?speech?recognition?process??
第二章理论基础??损失添加一正则化项来实现结构风险表示,通过正则化项的约束防止过学习的发??生。??假设样本数为n,最小结构风险关系模型如下图所示。??〃欠拟合|?|过拟合??\?i??—风险边界—??i?/??\\?丨?置信风险??经验风险???1?1?1????hi?hk?hn?VC?维??图2.2最小结构风险关系模型??Figure.2.2?Minimum?structural?risk?relationship?model??一般在机器学习过程中通过平衡经验风险与置信风险来调整模型,减少过拟??合与欠拟合的可能,同时将该思想应用于支持向量机,通过最大化分类边界获得??最小的VC维,从而降低学习系统的复杂性,进而实现结构风险最小化。??支持向量机(supportvectormachines,SVM)是一种二分类模型,它的基本??模型是定义在特征空间上不同于感知机的间隔最大线性分类器;SVM通过核函??数的使用使之处理非线性问题。SVM的学习策略就是间隔最大化,其等价于一??个求解凸二次规划的问题。基本思想是通过对学习样本进行非线性映射,将样本??映射到高维空间中,然后在高维空间中求取几何间隔最大的分离超平面,并利用??核函数实现内积运算,这样就使得在维数增加的情况下,计算复杂度却没有增加。??假设有训练样本{xyyj.yftl,/=1,?2,3,...,y?,X,为向量机输入,n为??样本数,y,.输出的1和-1代表正常和异常。SVM的目标就是寻求一个最优分类??超平面使》^?+?6?=?0,则满足??7;.(?wx.?+?Z?)?-?1?>?0???(2-17)??的训练样本成为支持
第二章理论基础??而当下最为流行的模型,无疑就是长短期记忆神经网络(LSTM)与卷积神??经网络(CNN)?了。声音从本质上讲可以看成一组连续的信号,而LSTM本身??能够很好地处理这类时序问题。LSTM的突出贡献就是解决了循环神经网络??(RNN)的长期依赖问题。其主要结构如下:?????????T?t?t????—-j—??A?.Uifil?A?+??h??J『??@?(x^)??图2.3长短期记忆神经网络模型??Figure.2.3?long?and?short?term?memory?neural?network?model??其通过细胞状态保证在链式结构下信息传输的畅通,通过遗忘门,输入门和输出??门决定信息的丢弃与添加。这样的结构使其成为时序问题中的经典模型。??一般来说卷积神经网络被广泛应用于计算机视觉,但时下很多主流的语音识??别系统都使用其进行声学建模,例如科大讯飞的语音识别框架。卷积神经网络可??以提供在时间和空间上的平移不变性卷积,在声学建模中可以利用卷积的不变性??来克服语音信号本身的多样性,从这个角度来看,则可以认为是将整个语音信号??分析得到的时频谱当作一张图像一样来处理。并且与LSTM相比CNN更容易实??现大规模并行化运算,所以近年来卷积神经网络成为声学建模的新宠。??传统的语音识别使用语音模型,词典,语言模型进行实现,它们对于整个语??音识别系统都是分开优化的,因此这两个模型优化的损失函数不是相同的,但是??语音识别本质上是一个序列识别问题,如果模型中的所有组件都能够联合优化,??很可能会获取更好的识别准确度,由此研究者们提出了端到端的语音识别。对于??端到端的
【参考文献】:
期刊论文
[1]用于课堂教学评估的教师肢体动作检测[J]. 闫晓炜,张朝晖,赵小燕,贾鹂宇. 中国教育信息化. 2019(16)
[2]课堂环境双模态情感评价系统设计与效果分析[J]. 郭雯雯,杨凤梅. 教学研究. 2019(03)
[3]智慧教育:价值引导与实践操作的融合[J]. 刘伟. 电化教育研究. 2017(06)
[4]增强现实(AR)技术的教育应用综述[J]. 蔡苏,王沛文,杨阳,刘恩睿. 远程教育杂志. 2016(05)
[5]基于PCA及机器学习的人脸识别应用研究[J]. 沈萍. 计算机教育. 2016(06)
[6]全局竞争和声搜索算法[J]. 夏红刚,欧阳海滨,高立群,孔祥勇. 控制与决策. 2016(02)
[7]智慧教育的三重境界:从环境、模式到体制[J]. 黄荣怀. 现代远程教育研究. 2014(06)
[8]国际智慧教育发展战略及其对我国的启示[J]. 陈耀华,杨现民. 现代教育技术. 2014(10)
[9]国内语音识别研究综述[J]. 于俊婷,刘伍颖,易绵竹,李雪,李娜. 计算机光盘软件与应用. 2014(10)
[10]智慧教育:教育信息化的新境界[J]. 祝智庭,贺斌. 电化教育研究. 2012(12)
硕士论文
[1]教育学视域下的智慧教育研究[D]. 刘伟.华中师范大学 2018
本文编号:3359462
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3359462.html
最近更新
教材专著