基于集成方法的情感分析
本文选题:集成方法 + 情感分析 ; 参考:《河北地质大学》2016年硕士论文
【摘要】:网络社交媒体为人们提供了快速便捷的交流环境,通过这些社交平台人们可以对社会舆论热点发表自己的观点和看法,情感分析是一种从观点和看法中分析人们所表达情感的技术,已成为当前自然语言处理的热点问题,在情感预测领域具有重大的应用前景。针对单分类算法模型的情感分析泛化能力较弱等问题,提出了集成方法的情感分析,泛化能力较好,在情感分析上有很好的适应性。本文研究的主要工作围绕以下两个方面展开。1.对目前比较流行的开放情感词典进行了分析,构建了情感分析中使用的情感词典,按照情感倾向划分了词汇库。根据微博短文本数据的特点,对数据预处理筛选出研究的语料库,并基于选取的特征,对语料库进行了向量表示。调查了情感分析的现有模型和常用的单分类算法模型分析优点和不足,并对单分类算法模型进行了实验验证。2.提出了一种异质集成方法的情感分析模型,解决了单分类算法模型在假设空间的训练集上进行学习时误选而导致泛化性能不佳等问题。基本思想是,首先,利用构建好的情感词典对微博短文本特征进行表示和选择。然后,根据不同的单分类算法模型特点将模型按照一定的策略进行集成,包括两种方式,一种是将两种或两种以上单分类算法模型的实验结果采用置信度加权平均的方法组合情感分析模型,选择置信度高的子分类器做分类决策;另一种是将分类器的分类结果和置信度作为更高一层集成分类器的特征的方法组合成情感分析模型。最后,设计实现舆情情感分析平台。实验结果表明了提出的集成方法对情感分析是有效和可行的。
[Abstract]:Internet social media provides a rapid and convenient environment for people to communicate. Through these social platforms, people can express their views and opinions to the hot spots of public opinion. Affective analysis is a technique to analyze the emotions expressed by people from the viewpoint and view. It has become a hot issue in natural language processing and has a great application prospect in the field of emotion prediction. Aiming at the problem that the generalization ability of emotion analysis of single classification algorithm model is weak, this paper puts forward the integration method of emotion analysis, which has good generalization ability and good adaptability in emotion analysis. The main work of this paper is focused on the following two aspects. 1. The open emotion dictionary which is popular at present is analyzed, the emotion dictionary used in emotion analysis is constructed, and the lexical database is divided according to emotion tendency. According to the characteristics of Weibo short text data, the corpus of the study is screened out by data preprocessing, and based on the selected features, the corpus is represented by vector. The advantages and disadvantages of the existing emotional analysis model and the commonly used single classification algorithm model are investigated, and the experimental verification of the single classification algorithm model is given. An affective analysis model of heterogeneous ensemble method is proposed to solve the problem of poor generalization performance caused by misselection of single classification algorithm model in training set in hypothesis space. The basic idea is: firstly, using the constructed affective dictionary to express and select the features of Weibo short text. Then, according to the characteristics of different single classification algorithm models, the model is integrated according to a certain strategy, including two ways, One is that the experimental results of two or more single classification algorithms are combined with the affective analysis model using the method of confidence weighted average, and the sub-classifier with high confidence level is selected to make classification decision. The other is to combine the classifier classification results with the confidence degree as the feature of a higher level integrated classifier to form an emotional analysis model. Finally, the design and implementation of public opinion emotional analysis platform. The experimental results show that the proposed integration method is effective and feasible for emotional analysis.
【学位授予单位】:河北地质大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP391.1
【参考文献】
相关期刊论文 前10条
1 苏莹;张勇;胡珀;涂新辉;;基于朴素贝叶斯与潜在狄利克雷分布相结合的情感分析[J];计算机应用;2016年06期
2 刘艳梅;;深度学习技术下的中文微博情感的分析与研究[J];软件;2016年05期
3 高琰;陈白帆;晁绪耀;毛芳;;基于对比散度-受限玻尔兹曼机深度学习的产品评论情感分析[J];计算机应用;2016年04期
4 张庆庆;刘西林;;基于深度信念网络的文本情感分类研究[J];西北工业大学学报(社会科学版);2016年01期
5 寇凯;;基于舆论数据的中文情感分析研究[J];无线互联科技;2016年01期
6 李景玉;张仰森;蒋玉茹;;基于多特征融合的中文微博评价对象抽取方法[J];计算机应用研究;2016年02期
7 陈永恒;左万利;林耀进;;基于主题种子词的情感分析方法[J];计算机应用;2015年09期
8 王文;王树锋;李洪华;;基于文本语义和表情倾向的微博情感分析方法[J];南京理工大学学报;2014年06期
9 张林;钱冠群;樊卫国;华琨;张莉;;轻型评论的情感分析研究[J];软件学报;2014年12期
10 赵煜;邵必林;边根庆;;一种融合词序信息的多粒度文本话题情感联合模型[J];西安交通大学学报;2014年11期
相关博士学位论文 前3条
1 李岩;文本情感分析中关键问题的研究[D];北京邮电大学;2014年
2 刘楠;面向微博短文本的情感分析研究[D];武汉大学;2013年
3 崔安颀;微博热点事件的公众情感分析研究[D];清华大学;2013年
相关硕士学位论文 前10条
1 刘政;基于知识元和集成学习的中文微博情感分析[D];大连理工大学;2015年
2 高伟;基于半监督集成学习的情感分类方法研究[D];苏州大学;2015年
3 娄鑫坡;基于K关联图的流分类算法及其在微博情感分析中的应用[D];郑州大学;2014年
4 李钰;微博情感词典的构建及其在微博情感分析中的应用研究[D];郑州大学;2014年
5 杨希;基于情感词典与规则结合的微博情感分析模型研究[D];安徽大学;2014年
6 刘坤林;短文本情感分析[D];上海交通大学;2014年
7 杜振雷;面向微博短文本的情感分析研究[D];北京信息科技大学;2013年
8 张想;面向热点话题型微博的情感分析研究[D];哈尔滨工业大学;2013年
9 李楚楚;评论文本的情感分析研究及其在信用评估中的应用[D];首都师范大学;2013年
10 张家红;集成分类学习算法研究[D];山东师范大学;2011年
,本文编号:2086805
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2086805.html