基于话题挖掘与情感分析的学习资源推荐研究
发布时间:2021-06-19 12:32
随着大规模在线开放课程(MOOC,Massive online open course)的飞速发展,越来越多的学习者开始接受并利用在线学习方式获取知识,在线学习平台也随之发展壮大。在各种学习平台上,海量的学习资源和交互数据伴随着学习者数量的增加不断产生。面对这些数据时,学习者如何选择合适的学习资源成为影响其参与在线课程学习效果的因素之一。由于学习者要花费大量的时间才能找到与自己学习风格和学习需求相符合的学习资源,增加了学习者的学习负担、降低了其学习效率。课程讨论文本是学习者对于课程知识内容、课程设置以及教学实施等方面的直接表述,是学习者真实学习状态和学习需求的体现。通过对课程讨论文本进行挖掘和分析为学习者推荐资源,有利于提高学习效率、快速而精确的匹配学习者学习需求、更好的实现个性化教育。本文的研究过程主要包括:第一,通过网络爬虫,获取学习者参与在线互动过程中产生的课程讨论文本数据,并对获取到的数据进行去重、降噪以及去停用词、分词等预处理,构成本文实验进行所需的语料库;第二,通过收集整理构建基于基于课程讨论的情感词典;第三,利用LDA话题模型和基于词典的情感分析方法实现针对学习者讨论文本...
【文章来源】:江南大学江苏省 211工程院校 教育部直属院校
【文章页数】:69 页
【学位级别】:硕士
【部分图文】:
研究思路
辈阋约啊按驶恪辈阕槌傻娜?惚匆端鼓P停?文档的生成过程是其核心。该模型认为文档(document)是由许多个话题(topic)构成,而每个话题又是由许多的词语(word)组成。其中,文档的主题服从参数为的Dirichlet分布,主题中的单词服从参数为的Dirichlet分布。因此,一个话题可以表示成以高频率出现在文本中的词汇的集合。所有文本对应的潜在话题集合具有一致性,文本可以通过观测得到,但是话题无法直接获取,借助LDA模型可以获取文本的关键词,用观测到的文本来推测文本中蕴含的话题。LDA模型的生成过程图如下图2-1所示:图2-1LDA模型的生成过程LDA话题模型作为本文进行话题挖掘的基础,其数学推导过程主要有文本建模以及训练过程(吉布斯采样,GibbsSampling)[46]。其相关参数和变量意义如下表2-1所示。
分类的常用方法有支持向量机(SupportVectorMachines,SVM)、神经网络(NeuralNetwork)、最大熵(MaximumEntropy,ME)、贝叶斯网络(BayesianNetwork)等;在研究过程中还有一些其他技术不能被归类于机器学习方法和基于词典的方法,一般称之为混合方法,比如形式概念分析(FormalConceptAnalysis,FCA)[50]以及模糊形式概念分析(FuzzyFormalConceptAnalysis,FFCA)[51],通过概念结构揭示目标及其属性之间的关系,能够有效识别不清晰、不完整的信息,被广泛应用在不同的领域。总体来看,基于文本的情感分析过程主要如下图2-2所示。图2-2文本情感分析基本过程从上图可知,基于文本的情感分析过程主要分为4个部分:(1)数据来源选择真实有效的数据对于实验进行至关重要,因此,要根据实际需要和科学的分析对数据来源的平台进行考查,从数据平台中选择高质量的、具有实际分析价值的数据。(2)数据处理为了使获取的数据在后续的实验中继续保持着高质量,需要对从平台中获取的原始数据进行处理,剔除其中的无用数据、重复数据等信息。(3)情感极性识别在特征词、情感词抽取之后,情感极性识别是整个情感分析过程中最为重要的一部分,如果情感极性判断有误,其结果会直接影响整个实验结果的准确性及有效性。(4)情感分析结果可视化在获取到情感分析结果之后,要将分析结果通过图表等直观的可视化手段展示出来,以便为用户或企业提供决策支持服务。考虑到在线课程文本数据数量以及实验的准确性,利用情感词典的方法进行情感分析,该方法主要依赖句子中积极情感词和消极情感词的出现次数来计算其整体的情感倾向。考虑到句子中程度副词、否定词的影响,其基本计算公式如下公式所示:Es=i=1nQwaiQwbiWi(2.7)
【参考文献】:
期刊论文
[1]智慧教育视野中的学习分析与个性化资源推荐[J]. 刘敏,郑明月. 中国电化教育. 2019(09)
[2]基于动态主题—情感演化模型的网络舆情信息分析[J]. 朱晓霞,宋嘉欣,孟建芳. 情报科学. 2019(07)
[3]教育资源个性化推荐方法研究与实现[J]. 李文欣,文勇军,唐立军. 计算机技术与发展. 2019(06)
[4]智能化学习环境下资源推荐的影响因素及权重的探索[J]. 马秀麟,梁静,李小文,苏幼园. 中国电化教育. 2019(03)
[5]国际教育大数据研究的热点、前沿和趋势——基于WOS数据库的量化分析[J]. 蒋鑫,洪明. 中国远程教育. 2019(02)
[6]基于表情符号的情感词典的构建研究[J]. 林江豪,顾也力,周咏梅,阳爱民,陈锦. 计算机技术与发展. 2019(06)
[7]基于主题相似性的在线评论情感分析[J]. 崔雪莲,那日萨,刘晓君. 系统管理学报. 2018(05)
[8]教师工作坊中学员话题挖掘方法及应用[J]. 何皓怡,刘清堂,吴林静,邓伟,郝怡雪. 中国电化教育. 2018(10)
[9]学习云空间中基于情感分析的学习推荐研究[J]. 黄昌勤,俞建慧,王希哲. 中国电化教育. 2018(10)
[10]基于论坛文本的互动话语分析模式构建与实践[J]. 左明章,赵蓉,王志锋,李香勇,徐燕丽. 电化教育研究. 2018(09)
硕士论文
[1]基于个性化推荐的在线学习系统研究与实现[D]. 巩晓悦.北京邮电大学 2019
[2]基于LDA主题模型的在线评论聚类分析与推荐[D]. 杨凡.大连理工大学 2018
[3]基于行为日志数据的MOOC学习者学习行为分析研究[D]. 王敏.华东师范大学 2016
[4]基于Web文本的图书评论倾向性分析方法的研究[D]. 郭书彤.东北师范大学 2015
[5]基于情感分类的产品评论垂直搜索引擎的研究[D]. 徐叶强.湖南工业大学 2012
[6]面向中文Web评论的情感分析技术研究[D]. 周城.国防科学技术大学 2011
本文编号:3237819
【文章来源】:江南大学江苏省 211工程院校 教育部直属院校
【文章页数】:69 页
【学位级别】:硕士
【部分图文】:
研究思路
辈阋约啊按驶恪辈阕槌傻娜?惚匆端鼓P停?文档的生成过程是其核心。该模型认为文档(document)是由许多个话题(topic)构成,而每个话题又是由许多的词语(word)组成。其中,文档的主题服从参数为的Dirichlet分布,主题中的单词服从参数为的Dirichlet分布。因此,一个话题可以表示成以高频率出现在文本中的词汇的集合。所有文本对应的潜在话题集合具有一致性,文本可以通过观测得到,但是话题无法直接获取,借助LDA模型可以获取文本的关键词,用观测到的文本来推测文本中蕴含的话题。LDA模型的生成过程图如下图2-1所示:图2-1LDA模型的生成过程LDA话题模型作为本文进行话题挖掘的基础,其数学推导过程主要有文本建模以及训练过程(吉布斯采样,GibbsSampling)[46]。其相关参数和变量意义如下表2-1所示。
分类的常用方法有支持向量机(SupportVectorMachines,SVM)、神经网络(NeuralNetwork)、最大熵(MaximumEntropy,ME)、贝叶斯网络(BayesianNetwork)等;在研究过程中还有一些其他技术不能被归类于机器学习方法和基于词典的方法,一般称之为混合方法,比如形式概念分析(FormalConceptAnalysis,FCA)[50]以及模糊形式概念分析(FuzzyFormalConceptAnalysis,FFCA)[51],通过概念结构揭示目标及其属性之间的关系,能够有效识别不清晰、不完整的信息,被广泛应用在不同的领域。总体来看,基于文本的情感分析过程主要如下图2-2所示。图2-2文本情感分析基本过程从上图可知,基于文本的情感分析过程主要分为4个部分:(1)数据来源选择真实有效的数据对于实验进行至关重要,因此,要根据实际需要和科学的分析对数据来源的平台进行考查,从数据平台中选择高质量的、具有实际分析价值的数据。(2)数据处理为了使获取的数据在后续的实验中继续保持着高质量,需要对从平台中获取的原始数据进行处理,剔除其中的无用数据、重复数据等信息。(3)情感极性识别在特征词、情感词抽取之后,情感极性识别是整个情感分析过程中最为重要的一部分,如果情感极性判断有误,其结果会直接影响整个实验结果的准确性及有效性。(4)情感分析结果可视化在获取到情感分析结果之后,要将分析结果通过图表等直观的可视化手段展示出来,以便为用户或企业提供决策支持服务。考虑到在线课程文本数据数量以及实验的准确性,利用情感词典的方法进行情感分析,该方法主要依赖句子中积极情感词和消极情感词的出现次数来计算其整体的情感倾向。考虑到句子中程度副词、否定词的影响,其基本计算公式如下公式所示:Es=i=1nQwaiQwbiWi(2.7)
【参考文献】:
期刊论文
[1]智慧教育视野中的学习分析与个性化资源推荐[J]. 刘敏,郑明月. 中国电化教育. 2019(09)
[2]基于动态主题—情感演化模型的网络舆情信息分析[J]. 朱晓霞,宋嘉欣,孟建芳. 情报科学. 2019(07)
[3]教育资源个性化推荐方法研究与实现[J]. 李文欣,文勇军,唐立军. 计算机技术与发展. 2019(06)
[4]智能化学习环境下资源推荐的影响因素及权重的探索[J]. 马秀麟,梁静,李小文,苏幼园. 中国电化教育. 2019(03)
[5]国际教育大数据研究的热点、前沿和趋势——基于WOS数据库的量化分析[J]. 蒋鑫,洪明. 中国远程教育. 2019(02)
[6]基于表情符号的情感词典的构建研究[J]. 林江豪,顾也力,周咏梅,阳爱民,陈锦. 计算机技术与发展. 2019(06)
[7]基于主题相似性的在线评论情感分析[J]. 崔雪莲,那日萨,刘晓君. 系统管理学报. 2018(05)
[8]教师工作坊中学员话题挖掘方法及应用[J]. 何皓怡,刘清堂,吴林静,邓伟,郝怡雪. 中国电化教育. 2018(10)
[9]学习云空间中基于情感分析的学习推荐研究[J]. 黄昌勤,俞建慧,王希哲. 中国电化教育. 2018(10)
[10]基于论坛文本的互动话语分析模式构建与实践[J]. 左明章,赵蓉,王志锋,李香勇,徐燕丽. 电化教育研究. 2018(09)
硕士论文
[1]基于个性化推荐的在线学习系统研究与实现[D]. 巩晓悦.北京邮电大学 2019
[2]基于LDA主题模型的在线评论聚类分析与推荐[D]. 杨凡.大连理工大学 2018
[3]基于行为日志数据的MOOC学习者学习行为分析研究[D]. 王敏.华东师范大学 2016
[4]基于Web文本的图书评论倾向性分析方法的研究[D]. 郭书彤.东北师范大学 2015
[5]基于情感分类的产品评论垂直搜索引擎的研究[D]. 徐叶强.湖南工业大学 2012
[6]面向中文Web评论的情感分析技术研究[D]. 周城.国防科学技术大学 2011
本文编号:3237819
本文链接:https://www.wllwen.com/jiaoyulunwen/ktjx/3237819.html