多特征情感词典在文本情感分析问题中的研究
发布时间:2022-02-11 12:55
随着我国互联网行业的迅速发展,如何从日益增长的海量数据中提取有效的信息成为当前的一个热门研究课题。文本情感分析作为自然语言处理的一个重要应用方向,可以进行分析、处理、判断文本的情感倾向,被广泛应用于舆情监控、信用评价、网络营销、产品与服务优化等领域。情感词典是文本情感分析的基础和重要工具,完善且精确的情感词典可以有效地提高文本情感分析的效果。现有的通用情感词典大多为情感词和情感极性值的组合,其情感倾向一般被设定为固定值。这种情感词典主观性较强,没有考虑情感词在不同语境下可能会表现出的不同情感倾向,具有一定的片面性。语句的长短、词语的频率和位置、词语之间的关联等包含了大量的文本特征信息,这些信息是词语情感强度变化的关键。本文将词语的文本特征信息加入到情感词典的构建过程中,以期找到不同文本语境下词语的特征信息与情感倾向的关系,从而使情感词典更好地适用于各个领域。本文总结了常见的三十余种文本特征并根据特征类别、所属级别等进行分类,在各个类别中寻找对词语的情感值有影响的特征。本文在对词语的文本特征和情感倾向的关系做出大量研究后,提出了基于特征的情感词典构建方法。算法的基本思想:选择文本特征,统...
【文章来源】:吉林大学吉林省211工程院校985工程院校教育部直属院校
【文章页数】:72 页
【学位级别】:硕士
【部分图文】:
文本情感分析的常用方法比较
第 2 章 构建情感词典的相关理论和技术据文本最突出的组织形式(特征项)在原有的特征空间上聚结果不一定与情感有关[60]。Kmeans 介绍ans 作为最常用的聚类算法之一,以其简洁性和准确性闻名,情感分析中。Kmeans 聚类算法的主要流程如下[61]:
图 3.1 单特征情感词典构建和查询特征情感词典构建方法的核心逻辑伪代码如下:begin设置评论数量 N、词语最小次数阈值 WAC、评论最小次数阈值 CACfor i = 0,N:for word = 0,len(i):记录评论 i 情感星级;选取特征计算函数,计算 i 特征值;加入情感星级-特征值列表;end forend for
【参考文献】:
期刊论文
[1]基于文本聚类与情感分析的群租房微博舆情量化研究[J]. 李泉,李萌,成洪权,蒋林秀,肖舒婷,王極可. 图书情报研究. 2019(01)
[2]基于文本聚类与情感分析的群租房微博舆情量化研究[J]. 李泉,李萌,成洪权,蒋林秀,肖舒婷,王極可. 图书情报研究. 2019 (01)
[3]文本情感分析研究[J]. 李青松. 现代计算机(专业版). 2019(04)
[4]融合多特征的TextRank关键词抽取方法[J]. 李航,唐超兰,杨贤,沈婉婷. 情报杂志. 2017(08)
[5]基于多特征融合的微博主题情感挖掘[J]. 黄发良,冯时,王大玲,于戈. 计算机学报. 2017(04)
[6]情感词典构建综述[J]. 梅莉莉,黄河燕,周新宇,毛先领. 中文信息学报. 2016(05)
[7]基于特征融合的层次结构微博情感分类[J]. 朱宪莹,刘箴,金炜,刘婷婷,刘翠娟,柴艳杰. 电信科学. 2016(07)
[8]基于情感特征的用户聚类分析[J]. 任伟,刘循. 中国新通信. 2016(05)
[9]情感词典自动构建方法综述[J]. 王科,夏睿. 自动化学报. 2016(04)
[10]基于话题聚类及情感强度的中文微博舆情分析[J]. 吴青林,周天宏. 情报理论与实践. 2016(01)
博士论文
[1]文本倾向性分析中的情感词典构建技术研究[D]. 杜伟夫.哈尔滨工业大学 2010
硕士论文
[1]基于多维度特征评论分类的研究[D]. 包友军.浙江大学 2017
[2]基于词典和机器学习组合的情感分析[D]. 丁蔚.西安邮电大学 2017
[3]基于多元特征融合和LSTM神经网络的中文评论情感分析[D]. 李科.太原理工大学 2017
[4]中文微博情感词典的构建研究与应用[D]. 於伟.上海师范大学 2017
[5]基于机器学习的微博评论信息倾向性分析的研究[D]. 汪淳.哈尔滨工业大学 2016
[6]基于社交网络的用户情感分析方法研究[D]. 陈强.重庆邮电大学 2016
[7]互联网评论文本情感分析研究[D]. 崔连超.山东大学 2015
[8]面向不均衡数据和情感词典构建的特征选择方法研究[D]. 吴金源.北京工业大学 2014
[9]基于情感常识的公众情感趋势预测[D]. 任巨伟.大连理工大学 2014
[10]面向情感倾向分析的微博表情情感词典构建及应用[D]. 王文远.东北大学 2012
本文编号:3620319
【文章来源】:吉林大学吉林省211工程院校985工程院校教育部直属院校
【文章页数】:72 页
【学位级别】:硕士
【部分图文】:
文本情感分析的常用方法比较
第 2 章 构建情感词典的相关理论和技术据文本最突出的组织形式(特征项)在原有的特征空间上聚结果不一定与情感有关[60]。Kmeans 介绍ans 作为最常用的聚类算法之一,以其简洁性和准确性闻名,情感分析中。Kmeans 聚类算法的主要流程如下[61]:
图 3.1 单特征情感词典构建和查询特征情感词典构建方法的核心逻辑伪代码如下:begin设置评论数量 N、词语最小次数阈值 WAC、评论最小次数阈值 CACfor i = 0,N:for word = 0,len(i):记录评论 i 情感星级;选取特征计算函数,计算 i 特征值;加入情感星级-特征值列表;end forend for
【参考文献】:
期刊论文
[1]基于文本聚类与情感分析的群租房微博舆情量化研究[J]. 李泉,李萌,成洪权,蒋林秀,肖舒婷,王極可. 图书情报研究. 2019(01)
[2]基于文本聚类与情感分析的群租房微博舆情量化研究[J]. 李泉,李萌,成洪权,蒋林秀,肖舒婷,王極可. 图书情报研究. 2019 (01)
[3]文本情感分析研究[J]. 李青松. 现代计算机(专业版). 2019(04)
[4]融合多特征的TextRank关键词抽取方法[J]. 李航,唐超兰,杨贤,沈婉婷. 情报杂志. 2017(08)
[5]基于多特征融合的微博主题情感挖掘[J]. 黄发良,冯时,王大玲,于戈. 计算机学报. 2017(04)
[6]情感词典构建综述[J]. 梅莉莉,黄河燕,周新宇,毛先领. 中文信息学报. 2016(05)
[7]基于特征融合的层次结构微博情感分类[J]. 朱宪莹,刘箴,金炜,刘婷婷,刘翠娟,柴艳杰. 电信科学. 2016(07)
[8]基于情感特征的用户聚类分析[J]. 任伟,刘循. 中国新通信. 2016(05)
[9]情感词典自动构建方法综述[J]. 王科,夏睿. 自动化学报. 2016(04)
[10]基于话题聚类及情感强度的中文微博舆情分析[J]. 吴青林,周天宏. 情报理论与实践. 2016(01)
博士论文
[1]文本倾向性分析中的情感词典构建技术研究[D]. 杜伟夫.哈尔滨工业大学 2010
硕士论文
[1]基于多维度特征评论分类的研究[D]. 包友军.浙江大学 2017
[2]基于词典和机器学习组合的情感分析[D]. 丁蔚.西安邮电大学 2017
[3]基于多元特征融合和LSTM神经网络的中文评论情感分析[D]. 李科.太原理工大学 2017
[4]中文微博情感词典的构建研究与应用[D]. 於伟.上海师范大学 2017
[5]基于机器学习的微博评论信息倾向性分析的研究[D]. 汪淳.哈尔滨工业大学 2016
[6]基于社交网络的用户情感分析方法研究[D]. 陈强.重庆邮电大学 2016
[7]互联网评论文本情感分析研究[D]. 崔连超.山东大学 2015
[8]面向不均衡数据和情感词典构建的特征选择方法研究[D]. 吴金源.北京工业大学 2014
[9]基于情感常识的公众情感趋势预测[D]. 任巨伟.大连理工大学 2014
[10]面向情感倾向分析的微博表情情感词典构建及应用[D]. 王文远.东北大学 2012
本文编号:3620319
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3620319.html
最近更新
教材专著