基于深度森林学习的评论文本情感分类研究
发布时间:2022-01-20 22:29
随着互联网时代的到来,中国的网民数量每年都呈现快速增长的趋势,尤其是诸如微博、美团等社会媒体的迅猛发展,更是给人们的生活带来了崭新的一面。用户可以通过这些新的载体自由地表达意见,而文本在这一过程中发挥着重要作用。因此,对文本进行情感分析已经成为广大研究人员热衷的一个方向。现阶段,人们在篇章级和句子级别的粗粒度文本情感分析方面已经做了很多研究,但是在面对产品评论这一类似文本时,粗粒度的文本情感分析却无法获取到情感所针对的具体对象。因此,本文从细粒度文本情感分析角度出发,以深度森林模型为基础分析文本的情感倾向性。本文的主要工作有:(1)提取文本特征。本文提取了文本的两类特征,分别是二元特征和情感语义概率特征。首先,本文以词典和句法依存分析为基础,并结合提出的六条规则提取文本的评价对象-评价词极性对;然后,对评价对象作聚类处理,以完成二元特征的提取;最后,为了弥补二元特征中存在的不足,本文结合词典和语义依存分析提取文本的情感语义概率特征,并对各特征作出归一化处理,以提高分类效率。(2)改进分类模型。首先,本文对深度森林模型级联层的表征学习结构作出改进,提高了级联森林的表征学习能力,解决了在训...
【文章来源】:郑州大学河南省 211工程院校
【文章页数】:63 页
【学位级别】:硕士
【部分图文】:
级联森林结构示意图
z 代表级联森林的层数,z∈Z。然后,级联森林将每一级的输征向量作为下一级森林的输入,表示为:xz←(x, Vz-1(x))。以林的分类准确率不再上升,则停止训练。因此,级联森林的应的。扫描窗口类似于卷积神经网络(CNN)中的滑动窗口,目的行扫描采样,这个结构可以增强级联森林对特征的学习效果述为:首先向系统输入大小为 S 的样本数据,然后通过一个对其进行滑动采样。如果输入的样本数据是序列形式,则采采样,公式(2.6)如下所示:P ( S L) 1入的样本数据呈图片形式,则采用公式(2.7)进行采样,公P [( S L) 1] [(S L) 1]处扫描步长为 1,那么经过扫描之后会生成 P 个子样本。以描过程用图 2.2 表示。
3 基于词典和依存分析的文本特征提取词语“差”与后面两句评论进行了分析,并作了相应关系的标注。因此,系统会继续根据这些关系进行分析,这样一来无疑会增加时间复杂度。所以,为了提升文本预处理过程的效率,本文将所有无法代表完整语句的标点符号均用“句号”替换。
【参考文献】:
期刊论文
[1]基于深度森林模型的火焰检测[J]. 朱晓妤,严云洋,刘以安,高尚兵. 计算机工程. 2018(07)
[2]基于SVM的酒店客户评论情感分析[J]. 石强强,赵应丁,杨红云. 计算机与现代化. 2017(03)
[3]分段卷积神经网络在文本情感分析中的应用[J]. 杜昌顺,黄磊. 计算机工程与科学. 2017(01)
[4]面向商品评论文本的情感分析与挖掘[J]. 李涵昱,钱力,周鹏飞. 情报科学. 2017(01)
[5]细粒度情感分析的酒店评论研究[J]. 李鸣,吴波,宋阳,朱梦尧,徐志广,张宏俊. 传感器与微系统. 2016(12)
[6]基于SVM的产品评论情感分析系统的设计与实现[J]. 彭德焰,胡欣宇. 物联网技术. 2016(11)
[7]警务应用中基于双向最大匹配法的中文分词算法实现[J]. 陶伟. 电子技术与软件工程. 2016(04)
[8]基于情感分析的企业产品级竞争对手识别研究——以用户评论为数据源[J]. 肖璐,陈果,刘继云. 图书情报工作. 2016(01)
[9]深度学习的昨天、今天和明天[J]. 余凯,贾磊,陈雨强,徐伟. 计算机研究与发展. 2013(09)
[10]基于随机森林的特征选择算法[J]. 姚登举,杨静,詹晓娟. 吉林大学学报(工学版). 2014(01)
硕士论文
[1]文本相似度算法在自动评分系统中的应用研究[D]. 欧阳经纶.湘潭大学 2017
[2]基于主题模型的文本情感分析研究[D]. 郝洁.太原理工大学 2017
[3]评论文本情感倾向性分析技术研究[D]. 王娜娜.北京交通大学 2017
[4]基于酒店领域情感词典的分类器研究[D]. 石馨.河北大学 2014
[5]基于集成学习的半监督学习算法研究[D]. 王轶初.西安电子科技大学 2011
本文编号:3599639
【文章来源】:郑州大学河南省 211工程院校
【文章页数】:63 页
【学位级别】:硕士
【部分图文】:
级联森林结构示意图
z 代表级联森林的层数,z∈Z。然后,级联森林将每一级的输征向量作为下一级森林的输入,表示为:xz←(x, Vz-1(x))。以林的分类准确率不再上升,则停止训练。因此,级联森林的应的。扫描窗口类似于卷积神经网络(CNN)中的滑动窗口,目的行扫描采样,这个结构可以增强级联森林对特征的学习效果述为:首先向系统输入大小为 S 的样本数据,然后通过一个对其进行滑动采样。如果输入的样本数据是序列形式,则采采样,公式(2.6)如下所示:P ( S L) 1入的样本数据呈图片形式,则采用公式(2.7)进行采样,公P [( S L) 1] [(S L) 1]处扫描步长为 1,那么经过扫描之后会生成 P 个子样本。以描过程用图 2.2 表示。
3 基于词典和依存分析的文本特征提取词语“差”与后面两句评论进行了分析,并作了相应关系的标注。因此,系统会继续根据这些关系进行分析,这样一来无疑会增加时间复杂度。所以,为了提升文本预处理过程的效率,本文将所有无法代表完整语句的标点符号均用“句号”替换。
【参考文献】:
期刊论文
[1]基于深度森林模型的火焰检测[J]. 朱晓妤,严云洋,刘以安,高尚兵. 计算机工程. 2018(07)
[2]基于SVM的酒店客户评论情感分析[J]. 石强强,赵应丁,杨红云. 计算机与现代化. 2017(03)
[3]分段卷积神经网络在文本情感分析中的应用[J]. 杜昌顺,黄磊. 计算机工程与科学. 2017(01)
[4]面向商品评论文本的情感分析与挖掘[J]. 李涵昱,钱力,周鹏飞. 情报科学. 2017(01)
[5]细粒度情感分析的酒店评论研究[J]. 李鸣,吴波,宋阳,朱梦尧,徐志广,张宏俊. 传感器与微系统. 2016(12)
[6]基于SVM的产品评论情感分析系统的设计与实现[J]. 彭德焰,胡欣宇. 物联网技术. 2016(11)
[7]警务应用中基于双向最大匹配法的中文分词算法实现[J]. 陶伟. 电子技术与软件工程. 2016(04)
[8]基于情感分析的企业产品级竞争对手识别研究——以用户评论为数据源[J]. 肖璐,陈果,刘继云. 图书情报工作. 2016(01)
[9]深度学习的昨天、今天和明天[J]. 余凯,贾磊,陈雨强,徐伟. 计算机研究与发展. 2013(09)
[10]基于随机森林的特征选择算法[J]. 姚登举,杨静,詹晓娟. 吉林大学学报(工学版). 2014(01)
硕士论文
[1]文本相似度算法在自动评分系统中的应用研究[D]. 欧阳经纶.湘潭大学 2017
[2]基于主题模型的文本情感分析研究[D]. 郝洁.太原理工大学 2017
[3]评论文本情感倾向性分析技术研究[D]. 王娜娜.北京交通大学 2017
[4]基于酒店领域情感词典的分类器研究[D]. 石馨.河北大学 2014
[5]基于集成学习的半监督学习算法研究[D]. 王轶初.西安电子科技大学 2011
本文编号:3599639
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3599639.html
最近更新
教材专著