当前位置:主页 > 科技论文 > 软件论文 >

基于迁移学习的情感分析算法的研究与实现

发布时间:2021-03-02 20:57
  随着Web2.0时代的到来,飞速发展的互联网极大地改变了人们表达意见、抒发情感的方式和途径,微博、论坛等社交平台不断涌现,人们逐渐习惯于在这些平台上发表评论,这些评论蕴含许多重要的信息,例如情感倾向性等,通过对评论文本进行情感分析能够辅助人们进行产品推荐、舆情分析等,因此探究性能良好的情感分析算法具有巨大的实际意义。常用的情感分析方法主要分为基于传统机器学习技术、基于情感词典和基于深度学习的方法。基于深度学习的方法依靠无监督训练的词向量来表示文本,但是这种方法没用充分表示出文本的上下文语境关系,而且经常用于处理文本的循环神经网络结构比较复杂,训练难度较大。另外,随着各个领域新产品的不断涌现,新的领域往往缺少大量的有标签数据来训练模型,因此,研究如何利用已有领域的有标签训练数据对新的领域进行情感分析具有重要意义。本文针对现有的情感分析算法存在的问题进行了研究,探究了迁移学习技术在情感分析算法中的应用,主要的工作内容包括以下三个方面:(1)针对无监督训练的词向量无法表示上下文语境关系的问题,本文提出基于模型迁移的分层注意力网络的情感分析算法,利用机器翻译任务训练一个编码器,并将这个编码器模... 

【文章来源】:北京邮电大学北京市 211工程院校 教育部直属院校

【文章页数】:58 页

【学位级别】:硕士

【部分图文】:

基于迁移学习的情感分析算法的研究与实现


图1-1用户对于惠普打印机的评价情况??,

机器学习,分类算法,总体框架


X??负向词语??图1-3基于词典的情感分类算法总体框架??基于词典的方法虽然实现方便.但是对情感词典的质量要求较高,而特定领??域的资料难以满足自然语言多变的特点,规则很难适用于大部分的场景。Pang[4]??等人最早提出将机器学习技术应用到文本情感分类问题中,开创了该领域的先河。??Chent5]等人提出利用观点评分模型探讨政治立场,但是人工标注每个领域足够的??样本需要花费较高的成本,这也严重限制了模型的应用。基于机器学习的方法则??将情感分类作为普遍的分类问题,机器学习的研究重点在于如何提取更有效的特??征。常用的特征有n-gram特征、TF_IDF特征等,但是这类方法依然需要依靠人??工干预进行设置

机器,领域


(1)域:域由特征空间Z和特征分布构成,其中Z?=?"[xpXp...,x,j?e?Z。??在迁移学习中,域主要分为源领域(SourceDomain)?和目标领域(TargetDomain)??Z)7.,其中源领域代表己经完成了学习并获得了相关经验的域,目标领域表示当??前要进行学习的新的域。在前面学习骑车的例子中,骑自行车是源领域,骑摩托??车为目标领域。假如两个领域之间存在差异,则边缘概率分布和特征空间也具有??相当大的差异。??(2)任务:对领域Z)而言,乃=>^,户(;^,任务分为目标预测函数/〇和??标记空间7两个模块,任务由T?=?{7,/〇}标识,目标函数/〇不能够利用推导??得出,利用训练过程能够得出,训练数据由构成,其中,'eX,??函数/〇可以用来预测对应的标签,从概率角度来说,/W可以表示为i^|x)。??以文本分类为例,7为所有标签的集合,对于一个二分类任务来说,7可以包括??正向、负向,而X则表示正向或者负向。??(3)迁移学习的定义:对于目标领域和训练任务IV、源领域Z)s和训练??任务Ts来说,第一步在源领域乃5和训练任务八上学习,第二步中将学到的“经??

【参考文献】:
期刊论文
[1]情感分类研究进展[J]. 陈龙,管子玉,何金红,彭进业.  计算机研究与发展. 2017(06)
[2]基于迁移学习的唐诗宋词情感分析[J]. 吴斌,吉佳,孟琳,石川,赵惠东,李仪清.  电子学报. 2016(11)
[3]迁移学习研究进展[J]. 庄福振,罗平,何清,史忠植.  软件学报. 2015(01)
[4]基于质心迁移的领域适应性情感分类[J]. 杨文让,王中卿,李培峰,朱巧明.  计算机应用与软件. 2011(12)

博士论文
[1]迁移学习在文本分类中的应用研究[D]. 孟佳娜.大连理工大学 2011

硕士论文
[1]基于特征关联的跨领域情感分类方法研究[D]. 欧倩倩.合肥工业大学 2014
[2]基于迁移学习的中文评论情感分类方法研究[D]. 马凤闸.大连理工大学 2012



本文编号:3059937

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3059937.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户44f70***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com