融合学习者背景信息的话题挖掘研究
发布时间:2021-05-15 21:22
如今,信息技术正在迅猛发展,互联网正改变着世界,大规模在线学习成为教育界的热点话题,各类学习平台已成为学习者们留下数据,发表文字来表达自己内心想法的重要平台。教育基础理论认为,最好的教育就是促进教育三要素(教育者,学习者,教育影响)的相互配合,相互了解,本文立足于教育理论,以华中师范大学云平台学习者在课后讨论区留下的文本数据为基础,结合学习者个体的背景信息数据,尝试对在线学习平台中学习者发表的文本数据进行研究,他们遇到的困境是什么?他们的兴趣话题是什么?以此建立教育者,教育管理者与学习者的了解与联系,便于快捷有效地对教育进行调整,使得教育能够达到最好的状态。在大量教育数据产生后,数据分析也应运而生,其中文本分析是研究学习者兴趣话题的重要手段。在文本分析中,较为困难的基础工作是对中文文本的预处理,一般采用TF-IDF算法进行文本特征化或进行中文文本分词。传统的文本分析方法是先进行人工标注文本数据,然后结合机器学习的基础方法进行研究。如朴素贝叶斯分类,K近邻分类法等。主要目的均是探究学习者的讨论话题,讨论类别。该类方法一般用于文本话题的二元识别,如识别文本数据中的话题是探索型还是非探索型。...
【文章来源】:华中师范大学湖北省 211工程院校 教育部直属院校
【文章页数】:70 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第一章 绪论
1.1 研究背景
1.2 国内外研究现状
1.2.1 话题识别的研究现状
1.2.2 概率话题模型的研究现状
1.2.3 文本可视化的研究现状
1.3 研究目的及意义
1.4 研究内容与论文结构
1.4.1 研究内容
1.4.2 论文结构
第二章 话题模型的相关技术研究
2.1 引言
2.2 文本预处理技术
2.2.1 文本过滤
2.2.2 文本特征化技术
2.2.3 中文文本的分词技术
2.3 话题模型
2.3.1 话题识别
2.3.2 概率话题模型
2.4 本章总结
第三章 基于学习者个体信息的潜在的狄利克雷分布语义模型
3.1 引言
3.2 基于LDA拓展的学习者-话题模型
3.2.1 参数估计理论
3.2.2 LDA话题建模
3.2.3 基于学习者背景信息的话题建模
3.2.4 吉布斯采样
3.3 模型评估
3.4 本章总结
第四章 基于I-LDA模型的实验设计与结果分析
4.1 实验设计
4.2 实验数据准备
4.3 参数选取
4.4 算法设计
4.5 实验结果的展示与分析
4.6 本章总结
第五章 文本可视化技术研究
5.1 引言
5.2 数据可视化技术研究
5.3 文本可视化技术研究
5.4 基于话题模型的可视化展示
5.5 本章总结
第六章 总结与展望
6.1 总结
6.2 展望
参考文献
在校期间发表的论文
致谢
【参考文献】:
期刊论文
[1]计算机文本信息挖掘技术在网络安全中的应用[J]. 韩文智. 华侨大学学报(自然科学版). 2016(01)
[2]当前国外MOOC热点话题的聚类研究[J]. 尤众喜,钱小龙,王周秀. 电化教育研究. 2015(12)
[3]大数据及其在教育中的应用[J]. 陆璟. 上海教育科研. 2013(09)
[4]基于主题情感混合模型的无监督文本情感分析[J]. 孙艳,周学广,付伟. 北京大学学报(自然科学版). 2013(01)
[5]学习分析技术:服务学习过程设计和优化[J]. 李艳燕,马韶茜,黄荣怀. 开放教育研究. 2012(05)
[6]参考咨询服务中的E-mail文本数据挖掘[J]. 晁成春. 农业图书情报学刊. 2005(12)
[7]CC4神经网络的分类性能理论分析[J]. 陈恩红,张振亚,王上飞,王煦法. 模式识别与人工智能. 2003(01)
[8]基于N-最短路径方法的中文词语粗分模型[J]. 张华平,刘群. 中文信息学报. 2002(05)
本文编号:3188356
【文章来源】:华中师范大学湖北省 211工程院校 教育部直属院校
【文章页数】:70 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第一章 绪论
1.1 研究背景
1.2 国内外研究现状
1.2.1 话题识别的研究现状
1.2.2 概率话题模型的研究现状
1.2.3 文本可视化的研究现状
1.3 研究目的及意义
1.4 研究内容与论文结构
1.4.1 研究内容
1.4.2 论文结构
第二章 话题模型的相关技术研究
2.1 引言
2.2 文本预处理技术
2.2.1 文本过滤
2.2.2 文本特征化技术
2.2.3 中文文本的分词技术
2.3 话题模型
2.3.1 话题识别
2.3.2 概率话题模型
2.4 本章总结
第三章 基于学习者个体信息的潜在的狄利克雷分布语义模型
3.1 引言
3.2 基于LDA拓展的学习者-话题模型
3.2.1 参数估计理论
3.2.2 LDA话题建模
3.2.3 基于学习者背景信息的话题建模
3.2.4 吉布斯采样
3.3 模型评估
3.4 本章总结
第四章 基于I-LDA模型的实验设计与结果分析
4.1 实验设计
4.2 实验数据准备
4.3 参数选取
4.4 算法设计
4.5 实验结果的展示与分析
4.6 本章总结
第五章 文本可视化技术研究
5.1 引言
5.2 数据可视化技术研究
5.3 文本可视化技术研究
5.4 基于话题模型的可视化展示
5.5 本章总结
第六章 总结与展望
6.1 总结
6.2 展望
参考文献
在校期间发表的论文
致谢
【参考文献】:
期刊论文
[1]计算机文本信息挖掘技术在网络安全中的应用[J]. 韩文智. 华侨大学学报(自然科学版). 2016(01)
[2]当前国外MOOC热点话题的聚类研究[J]. 尤众喜,钱小龙,王周秀. 电化教育研究. 2015(12)
[3]大数据及其在教育中的应用[J]. 陆璟. 上海教育科研. 2013(09)
[4]基于主题情感混合模型的无监督文本情感分析[J]. 孙艳,周学广,付伟. 北京大学学报(自然科学版). 2013(01)
[5]学习分析技术:服务学习过程设计和优化[J]. 李艳燕,马韶茜,黄荣怀. 开放教育研究. 2012(05)
[6]参考咨询服务中的E-mail文本数据挖掘[J]. 晁成春. 农业图书情报学刊. 2005(12)
[7]CC4神经网络的分类性能理论分析[J]. 陈恩红,张振亚,王上飞,王煦法. 模式识别与人工智能. 2003(01)
[8]基于N-最短路径方法的中文词语粗分模型[J]. 张华平,刘群. 中文信息学报. 2002(05)
本文编号:3188356
本文链接:https://www.wllwen.com/jiaoyulunwen/jiaoyuxinli/3188356.html