当前位置:主页 > 科技论文 > 软件论文 >

基于AF模型的跨领域情感词典构建方法研究

发布时间:2018-05-19 05:22

  本文选题:情感倾向 + 跨领域 ; 参考:《华中科技大学》2016年硕士论文


【摘要】:随着web2.0的快速发展,用户变成了互联网内容贡献的主力,大量用户产生的主观性文本充斥了人们的视野。基于这些主观性文本的情感分析成为了近些年的研究热点。情感词典的构建是情感分析的基础工作,然而构建情感词典时存在不平衡语料问题,所以,针对这个问题的跨领域情感词典构建研究也正在获得越来越多人的关注。目前的跨领域情感词典构建方法大都需要很多的人工标注信息,这些标注信息需要投入大量的人力和时间才能得到,而且还不够可靠,针对这个问题,提出一种新的基于AF模型的跨领域情感词典构建方法,该方法仅需要源领域中有词语级的标注信息,就可以利用词语之间的上下文相似度来判断目标领域中词语的倾向性,从而构建情感词典。此构建方法主要分为三个内容,第一个内容是语料数据的预处理,主要对语料中的句子进行断句,分词等处理;第二个内容是源领域和目标领域AF模型的建立,将两个领域语料的预处理结果建立成AF模型;第三个内容是目标领域情感词倾向性的判定,此为所提出的构建方法的核心内容,其中基于AF模型提出了两个新的统计量——领域差异度和相对亲和度。领域差异度用来区分领域相关情感词和领域无关情感词,相对亲和度用于计算两个领域间的情感词的上下文相似度。在这两个统计量的基础上,结合建立的模型,给出一个倾向性判定算法。通过倾向性的判定结果,将判断出的正向情感词和负向情感词结合在一起就构成了目标领域的领域情感词典。最后,在COAE2011提供的评测数据基础上,将所提出的词典构建方法与SO_PMI方法、以及融合上下文的构建方法进行对比分析,验证本方法的有效性。除此之外,通过实验不同参数对所提出构建方法的结果影响,来分析此跨领域词典构建方法的特性。
[Abstract]:With the rapid development of web2.0, users have become the main contribution of Internet content, and a large number of subjective texts produced by users are flooded with people's vision. Emotional analysis based on these subjective texts has become a hot topic in recent years. The construction of emotion dictionary is the basic work of emotion analysis. However, there is an unbalanced corpus problem in the construction of emotion dictionary. Therefore, more and more people are paying attention to the cross-domain emotion dictionary construction. At present, most of the cross-domain affective dictionary construction methods need a lot of manual tagging information, which needs a lot of manpower and time to get, and is not reliable enough, in order to solve this problem, A new cross-domain affective dictionary construction method based on AF model is proposed. This method only requires tagging information at the word level in the source domain, and can use the contextual similarity between words to judge the tendency of the words in the target domain. Thus construct the emotion dictionary. The method is mainly divided into three parts: the first is the preprocessing of corpus data, the second is the construction of AF model in the source and target fields, which mainly deals with sentence breakage and word segmentation in the corpus. The preprocessing results of the two domain corpus are established into AF model. The third is the judgment of the tendency of emotional words in the target domain, which is the core content of the proposed construction method. Based on AF model, two new statistics, domain difference degree and relative affinity degree, are proposed. Domain difference is used to distinguish domain-related affective words from domain-independent affective words, and relative affinity is used to calculate the contextual similarity of affective words between two domains. On the basis of these two statistics and combined with the established model, a decision algorithm of tendency is given. Through the judgment result of tendency, combining the positive affective words and negative affective words to form the domain emotion dictionary of the target domain. Finally, on the basis of the evaluation data provided by COAE2011, the method of dictionary construction is compared with the method of SO_PMI, and the method of constructing fusion context is compared to verify the validity of this method. In addition, the characteristics of this cross-domain dictionary construction method are analyzed by the influence of different parameters on the results of the proposed method.
【学位授予单位】:华中科技大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP391.1

【参考文献】

相关期刊论文 前4条

1 唐浩浩;王波;周杰;陈东;刘绍毓;;基于词亲和度的微博词语语义倾向识别算法[J];数据采集与处理;2015年01期

2 周咏梅;阳爱民;杨佳能;;一种新闻评论情感词典的构建方法[J];计算机科学;2014年08期

3 周咏梅;杨佳能;阳爱民;;面向文本情感分析的中文情感词典构建方法[J];山东大学学报(工学版);2013年06期

4 阳爱民;林江豪;周咏梅;;中文文本情感词典构建方法[J];计算机科学与探索;2013年11期

相关博士学位论文 前2条

1 杨玉珍;基于Web评论信息的倾向性分析关键技术研究[D];山东师范大学;2014年

2 王占一;Web文本挖掘中若干问题的研究[D];北京邮电大学;2012年

相关硕士学位论文 前4条

1 刘贤友;面向电子商务的评论文本情感分析研究[D];中国科学技术大学;2015年

2 张永田;词激活力模型在中文词发现中的应用研究[D];北京邮电大学;2013年

3 吕文龙;基于AF模型的语义相关度的研究与应用[D];北京邮电大学;2013年

4 唐都钰;领域自适应的中文情感分析词典构建研究[D];哈尔滨工业大学;2012年



本文编号:1908875

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1908875.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户e2de4***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com