汉藏双语情感词典构建及情感计算研究
发布时间:2022-12-11 12:34
随着网络的快速发展,越来越多的少数民族的人们通过微博来发表观点、表达情感、交流心得。藏文微博文本的研究不仅可以了解少数民族的日常生活和文化,还可以获得少数民族用户对于某类服务、产品的态度,也将有利于少数民族地区社会服务质量的提升、合理政策的颁布。本文以汉藏双语情感词典构建为基础,研究了藏文微博文本的情感计算模型。研究内容主要包括:(1)总结分析了当前情感词典构建和国外、中文、藏文文本情感计算的技术和最新的研究成果。(2)利用已有的中文情感词典资源自动构建汉藏双语情感词典,不但解决了藏文词典构建费时费力的问题,还保证了藏文情感词典的正确性和足够多的词汇。基于构建的情感词典对藏文微博文本进行情感计算,实验结果,准确率达到76.6%,表明情感词典达到了实用性效果。(3)针对原始数据集较小的问题,研究构建了藏文同反义词词典,并通过同反义词汇替换的方式,实现了数据的自动扩充。(4)根据卷积神经网络和长短时记忆网络的特点,提出了CLSTM混合深度学习模型,取得了较好的情感计算效果,准确率达到了85.1%。研究了模型参数优化等问题,使模型达到最优效果。
【文章页数】:53 页
【学位级别】:硕士
【文章目录】:
中文摘要
Abstract
第一章 绪论
1.1 研究背景及意义
1.2 国内外研究现状
1.2.1 情感词典的构建国内外研究现状
1.2.2 情感计算国内外研究现状
1.2.3 情感词典资源现状
1.3 课题的主要研究内容及创新点
1.3.1 选题的主要研究内容
1.3.2 课题的创新点
1.4 本文的结构安排
第二章 文本情感计算相关介绍
2.1 概述
2.2 文本预处理
2.2.1 分词技术
2.2.2 去停用词
2.3 基于情感词典的情感计算原理
2.4 基于机器学习情感计算流程
2.5 Word2Vec简介
2.5.1 Word2Vec神经网络架构
2.5.2 Skip-Gram(Continuous Skip-Gram Model)模型
2.6 基于深度学习情感计算原理
2.6.1 卷积神经网络
2.6.2 长短时记忆神经网络
2.7 本章小结
第三章 汉藏双语情感词典构建
3.1 概述
3.2 《汉藏大辞典》数据整理
3.3 中文情感词典资源整理
3.4 汉藏双语情感词典构建
3.4.1 汉藏双语情感词典构建
3.4.2 构建结果分析
3.5 本章小结
第四章 藏文微博文本情感计算
4.1 概述
4.2 数据扩充
4.2.1 基于同反义词词典的数据扩充
4.2.2 原始藏文微博文本语料
4.3 基于情感词典的藏文微博情感计算
4.3.1 未出现转折词
4.3.2 出现转折词
4.3.3 情感倾向计算
4.4 CLSTM混合深度学习模型的藏文微博情感计算
4.4.1 网络模型
4.4.2 模型参数优化
4.5 本章小结
第五章 实验及结果分析
5.1 概述
5.2 环境介绍
5.2.1 硬件环境
5.2.2 软件环境
5.3 基于情感词典情感计算及结果分析
5.4 基于CLSTM模型的结果与分析
5.4.1 实验数据
5.4.2 结果与分析
5.5 本章小结
第六章 总结与展望
6.1 总结
6.2 展望
参考文献
作者在读期间科研成果简介
致谢
【参考文献】:
期刊论文
[1]基于深度学习的领域情感词典自动构建——以金融领域为例[J]. 胡家珩,岑咏华,吴承尧. 数据分析与知识发现. 2018(10)
[2]基于深度循环神经网络的跨领域文本情感分析[J]. 余传明. 图书情报工作. 2018(11)
[3]基于情感词典的藏语文本句子情感分类[J]. 闫晓东,黄涛. 中文信息学报. 2018(02)
[4]基于词典与机器学习的藏文微博情感分析研究[J]. 杨志. 软件. 2017(11)
[5]基于词向量的藏文情感词典的构建方法研究[J]. 巴桑卓玛,李苗苗,高定国. 电子技术与软件工程. 2017(20)
[6]基于多特征的藏文微博情感倾向性分析[J]. 江涛,袁斌,于洪志,加羊吉. 中文信息学报. 2017(03)
[7]基于词向量的跨领域中文情感词典构建方法[J]. 冯超,梁循,李亚平,周小平,李晓菲. 数据采集与处理. 2017(03)
[8]基于Word2Vec的情感词典自动构建与优化[J]. 杨小平,张中夏,王良,张永俊,马奇凤,吴佳楠,张悦. 计算机科学. 2017(01)
[9]深度学习算法在藏文情感分析中的应用研究[J]. 普次仁,侯佳林,刘月,翟东海. 计算机科学与探索. 2017(07)
[10]基于关联规则挖掘和极性分析的商品评论情感词典构建[J]. 钟敏娟,万常选,刘德喜. 情报学报. 2016 (05)
硕士论文
[1]基于深度学习的微博文本情感分析研究[D]. 宋梦姣.南京大学 2018
[2]面向社交网络特定话题的情感词典自构建方法研究[D]. 张欢.上海师范大学 2018
[3]基于扩展词典和规则的中文微博情感分析[D]. 李继东.北京交通大学 2018
[4]一种基于词典的文本情感分析算法的实现[D]. 姚文杰.陕西师范大学 2017
[5]藏文文本情感分析方法研究[D]. 李苗苗.西藏大学 2017
[6]藏文微博情感分类研究与实现[D]. 袁斌.西北民族大学 2016
[7]基于深度学习的情感词向量生成模型研究[D]. 焦晨晨.北京邮电大学 2016
[8]藏文句子倾向性分析研究[D]. 杜雪峰.中央民族大学 2015
本文编号:3718789
【文章页数】:53 页
【学位级别】:硕士
【文章目录】:
中文摘要
Abstract
第一章 绪论
1.1 研究背景及意义
1.2 国内外研究现状
1.2.1 情感词典的构建国内外研究现状
1.2.2 情感计算国内外研究现状
1.2.3 情感词典资源现状
1.3 课题的主要研究内容及创新点
1.3.1 选题的主要研究内容
1.3.2 课题的创新点
1.4 本文的结构安排
第二章 文本情感计算相关介绍
2.1 概述
2.2 文本预处理
2.2.1 分词技术
2.2.2 去停用词
2.3 基于情感词典的情感计算原理
2.4 基于机器学习情感计算流程
2.5 Word2Vec简介
2.5.1 Word2Vec神经网络架构
2.5.2 Skip-Gram(Continuous Skip-Gram Model)模型
2.6 基于深度学习情感计算原理
2.6.1 卷积神经网络
2.6.2 长短时记忆神经网络
2.7 本章小结
第三章 汉藏双语情感词典构建
3.1 概述
3.2 《汉藏大辞典》数据整理
3.3 中文情感词典资源整理
3.4 汉藏双语情感词典构建
3.4.1 汉藏双语情感词典构建
3.4.2 构建结果分析
3.5 本章小结
第四章 藏文微博文本情感计算
4.1 概述
4.2 数据扩充
4.2.1 基于同反义词词典的数据扩充
4.2.2 原始藏文微博文本语料
4.3 基于情感词典的藏文微博情感计算
4.3.1 未出现转折词
4.3.2 出现转折词
4.3.3 情感倾向计算
4.4 CLSTM混合深度学习模型的藏文微博情感计算
4.4.1 网络模型
4.4.2 模型参数优化
4.5 本章小结
第五章 实验及结果分析
5.1 概述
5.2 环境介绍
5.2.1 硬件环境
5.2.2 软件环境
5.3 基于情感词典情感计算及结果分析
5.4 基于CLSTM模型的结果与分析
5.4.1 实验数据
5.4.2 结果与分析
5.5 本章小结
第六章 总结与展望
6.1 总结
6.2 展望
参考文献
作者在读期间科研成果简介
致谢
【参考文献】:
期刊论文
[1]基于深度学习的领域情感词典自动构建——以金融领域为例[J]. 胡家珩,岑咏华,吴承尧. 数据分析与知识发现. 2018(10)
[2]基于深度循环神经网络的跨领域文本情感分析[J]. 余传明. 图书情报工作. 2018(11)
[3]基于情感词典的藏语文本句子情感分类[J]. 闫晓东,黄涛. 中文信息学报. 2018(02)
[4]基于词典与机器学习的藏文微博情感分析研究[J]. 杨志. 软件. 2017(11)
[5]基于词向量的藏文情感词典的构建方法研究[J]. 巴桑卓玛,李苗苗,高定国. 电子技术与软件工程. 2017(20)
[6]基于多特征的藏文微博情感倾向性分析[J]. 江涛,袁斌,于洪志,加羊吉. 中文信息学报. 2017(03)
[7]基于词向量的跨领域中文情感词典构建方法[J]. 冯超,梁循,李亚平,周小平,李晓菲. 数据采集与处理. 2017(03)
[8]基于Word2Vec的情感词典自动构建与优化[J]. 杨小平,张中夏,王良,张永俊,马奇凤,吴佳楠,张悦. 计算机科学. 2017(01)
[9]深度学习算法在藏文情感分析中的应用研究[J]. 普次仁,侯佳林,刘月,翟东海. 计算机科学与探索. 2017(07)
[10]基于关联规则挖掘和极性分析的商品评论情感词典构建[J]. 钟敏娟,万常选,刘德喜. 情报学报. 2016 (05)
硕士论文
[1]基于深度学习的微博文本情感分析研究[D]. 宋梦姣.南京大学 2018
[2]面向社交网络特定话题的情感词典自构建方法研究[D]. 张欢.上海师范大学 2018
[3]基于扩展词典和规则的中文微博情感分析[D]. 李继东.北京交通大学 2018
[4]一种基于词典的文本情感分析算法的实现[D]. 姚文杰.陕西师范大学 2017
[5]藏文文本情感分析方法研究[D]. 李苗苗.西藏大学 2017
[6]藏文微博情感分类研究与实现[D]. 袁斌.西北民族大学 2016
[7]基于深度学习的情感词向量生成模型研究[D]. 焦晨晨.北京邮电大学 2016
[8]藏文句子倾向性分析研究[D]. 杜雪峰.中央民族大学 2015
本文编号:3718789
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3718789.html
最近更新
教材专著