基于情感词向量优化的微博评论情感分析
发布时间:2021-04-16 14:11
随着微博这类社交平台不断地壮大发展,基于微博语料的分析技术也备受学术界的关注,其中,情感分析技术更是成为其热门研究领域。在情感分析任务中,基于语料库上下文信息训练的词向量并不能很好地区分语境相同但语义不同的词汇,这会导致“语义相反的词,具有相似度高的词向量”,从而降低情感分析的精度。本文主要研究中文微博的情感分析,为了缓解上述问题对情感分析任务的影响,本文重点研究了情感词向量的优化,提出了一种结合情感词典的情感词向量优化模型。此外,情感词典是自然语言处理领域至关重要的研究工具,对它构建的研究有着重要的意义。本文由于需要使用带情感强度标注的情感词典,所以对其构建方法进行了研究,提出了一种融合SO-PMI算法、HowNet词汇相似度和词向量相似度的情感词典构建方法,并将其运用到本文提出的情感词向量优化模型中。本文所做的主要工作如下:(1)考虑到本文需要用到有情感强度等级标注的情感词典,我们在现有的研究基础上,提出了一种情感词典构建方法。该方法融合了SO-PMI算法、HowNet词汇相似度和词向量相似度,弥补了以上方法的缺点,能半监督地构建带有情感强度等级划分的情感词典。通过实验证明,我们的...
【文章来源】:湖南大学湖南省 211工程院校 985工程院校 教育部直属院校
【文章页数】:71 页
【学位级别】:硕士
【部分图文】:
卷积神经网络模型
长短期记忆网络模型
LSTM网络单元图
【参考文献】:
期刊论文
[1]基于Good-Turing平滑SO-PMI算法构建微博情感词典方法的研究[J]. 姜伶伶,何中市,张航. 现代计算机(专业版). 2018(10)
[2]基于平滑SO-PMI算法的微博情感词典构建方法研究[J]. 杜锐,朱艳辉,田海龙,刘璟,马进. 湖南工业大学学报. 2015(05)
[3]基于词向量的情感新词发现方法[J]. 杨阳,刘龙飞,魏现辉,林鸿飞. 山东大学学报(理学版). 2014(11)
[4]结合依存关联分析和规则统计分析的情感词库构建方法[J]. 李勇敢,周学广,孙艳,张焕国. 武汉大学学报(理学版). 2013(05)
[5]基于HowNet和PMI的词语情感极性计算[J]. 王振宇,吴泽衡,胡方涛. 计算机工程. 2012(15)
[6]基于情感词典扩展技术的网络舆情倾向性分析[J]. 杨超,冯时,王大玲,杨楠,于戈. 小型微型计算机系统. 2010(04)
[7]知网的理论发现[J]. 董振东,董强,郝长伶. 中文信息学报. 2007(04)
[8]情感词汇本体的构造[J]. 徐琳宏,林鸿飞,潘宇,任惠,陈建美. 情报学报. 2008 (02)
本文编号:3141581
【文章来源】:湖南大学湖南省 211工程院校 985工程院校 教育部直属院校
【文章页数】:71 页
【学位级别】:硕士
【部分图文】:
卷积神经网络模型
长短期记忆网络模型
LSTM网络单元图
【参考文献】:
期刊论文
[1]基于Good-Turing平滑SO-PMI算法构建微博情感词典方法的研究[J]. 姜伶伶,何中市,张航. 现代计算机(专业版). 2018(10)
[2]基于平滑SO-PMI算法的微博情感词典构建方法研究[J]. 杜锐,朱艳辉,田海龙,刘璟,马进. 湖南工业大学学报. 2015(05)
[3]基于词向量的情感新词发现方法[J]. 杨阳,刘龙飞,魏现辉,林鸿飞. 山东大学学报(理学版). 2014(11)
[4]结合依存关联分析和规则统计分析的情感词库构建方法[J]. 李勇敢,周学广,孙艳,张焕国. 武汉大学学报(理学版). 2013(05)
[5]基于HowNet和PMI的词语情感极性计算[J]. 王振宇,吴泽衡,胡方涛. 计算机工程. 2012(15)
[6]基于情感词典扩展技术的网络舆情倾向性分析[J]. 杨超,冯时,王大玲,杨楠,于戈. 小型微型计算机系统. 2010(04)
[7]知网的理论发现[J]. 董振东,董强,郝长伶. 中文信息学报. 2007(04)
[8]情感词汇本体的构造[J]. 徐琳宏,林鸿飞,潘宇,任惠,陈建美. 情报学报. 2008 (02)
本文编号:3141581
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3141581.html
最近更新
教材专著