基于迁移学习的方面级文本情感分析算法研究与应用
发布时间:2021-02-10 06:27
日常生活中,人们会将海量的评论信息通过多种手段发布到各个社交网站和购物网站中,表达个人积极或者消极,支持或者反对的情绪。情感分析(Sentiment Analysis,SA)运用计算机技术,帮助用户以更快的速度挖掘、整理以及分析这类评论信息。方面级情感分析(Aspect-Based Sentiment Analysis,ABSA)是情感分析的一种,其提取针对实体的各个方面发表的意见,是一种细化的情感分析模型,方面级情感分析的重要步骤之一是方面提取。本文基于产品评论数据,研究了基于迁移学习的方面提取算法。主要研究内容包括以下几点:(1)提出一种方面提取的迁移学习算法(Transfer Learning Algorithms for Aspect Extraction,TLAE)。此算法将标签传播算法(Label Propagation Algorithm,LPA)思想与迁移学习框架相结合。第一步,句法分析。对原始评论数据进行句法分析,提取出所有领域文本评论数据的语言特征,实现原始特征空间从高维降到低维;第二步,构建跨域数据表示图。图节点包括源领域数据的方面标签、目标域数据的方面候选标签和...
【文章来源】:西北师范大学甘肃省
【文章页数】:53 页
【学位级别】:硕士
【部分图文】:
不同算法对英文数据的F1值描述
西北师范大学硕士学位论文28图3-6不同算法对英文数据的F1值描述图3-7不同算法对中文数据的F1值描述图3-7列出了各类算法在6组中文数据集上的F1值,从图中可以看出,当目标域数据集为“相机1”和“相机2”时,算法TCBHN取得了最好的分类效果,TLAE算法分类效果居中;当目标域数据集为“手机”和“平板”时,算法MLP取得了最好的分类效果,TLAE算法相比于其他算法,也具有竞争力;当目标域数据集为“水果”和“衣服”时,TLAE算法取得了最佳分类性能。2.值对分类精度的影响将领域相关性分为高、低、中三个等级,图3-8表示了在不同算法中领域相关性对英文数据分类精度的影响,图3-9表示了在不同算法中领域相关性对中文数
第3章基于LPA的方面提取迁移学习算法29据分类精度的影响,从两图看出,当>70%,即领域相关性为“高”时,TLAE算法的分类精确度较低;当30%<70%,即领域相关性为“中”时,TLAE算法的分类精确度逐渐增高;当30%,即领域相关性为“低”时,TLAE算法的分类精确度最高。且从图中TLAE算法的线性趋势来看,随着领域相关性的下降,TLAE算法的分类效果逐渐优越,证明了TLAE算法在跨域迁移中的有效性。图3-8值对英文数据分类精度的影响图3-9值对中文数据分类精度的影响3.不同算法分类时间比较TLAE算法在计算时间上也是有利的,表3-7记录了不同算法在6组英文数据上的运行时间,表3-8记录了不同算法在6组中文数据上的运行时间,单位为秒。从两表可以看出,即使与NB等简单方法相比,TLAE算法在方面提取任务中的
【参考文献】:
期刊论文
[1]情感分析中的方面提取综述[J]. 陈苹,冯林. 计算机应用. 2018(S2)
[2]迁移学习研究综述[J]. 王惠. 电脑知识与技术. 2017(32)
[3]面向汽车评论的细粒度情感分析方法研究[J]. 陈炳丰,郝志峰,蔡瑞初,温雯,王丽娟,黄浩,蔡晓凤. 广东工业大学学报. 2017(03)
[4]基于语义约束LDA的商品特征和情感词提取[J]. 彭云,万常选,江腾蛟,刘德喜,刘喜平,廖国琼. 软件学报. 2017(03)
[5]基于半监督的SVM迁移学习文本分类算法[J]. 谭建平,刘波,肖燕珊. 无线互联科技. 2016(04)
[6]基于情感分析的企业产品级竞争对手识别研究——以用户评论为数据源[J]. 肖璐,陈果,刘继云. 图书情报工作. 2016(01)
[7]主题网络爬虫研究综述[J]. 刘金红,陆余良. 计算机应用研究. 2007(10)
博士论文
[1]观点挖掘中评价对象抽取方法的研究[D]. 刘倩.东南大学 2016
硕士论文
[1]基于迁移学习的情感分类研究与应用[D]. 段秀玉.北京邮电大学 2019
[2]基于半监督学习的观点挖掘算法的研究与实现[D]. 吴春叶.北京邮电大学 2019
[3]基于主题模型的无监督方面级观点挖掘算法研究[D]. 冯晋田.华中科技大学 2019
[4]一种实例迁移学习算法的改进研究[D]. 李毅.西北师范大学 2018
[5]基于SVM的文本情感分类研究及应用[D]. 陈志珍.大连海事大学 2017
[6]搜索引擎中通用爬虫系统的研究与设计[D]. 高龙.吉林大学 2013
[7]基于迁移学习的中文评论情感分类方法研究[D]. 马凤闸.大连理工大学 2012
[8]中文情感词汇本体的构建及其应用[D]. 陈建美.大连理工大学 2009
[9]基于实例和特征的迁移学习算法研究[D]. 戴文渊.上海交通大学 2009
本文编号:3026938
【文章来源】:西北师范大学甘肃省
【文章页数】:53 页
【学位级别】:硕士
【部分图文】:
不同算法对英文数据的F1值描述
西北师范大学硕士学位论文28图3-6不同算法对英文数据的F1值描述图3-7不同算法对中文数据的F1值描述图3-7列出了各类算法在6组中文数据集上的F1值,从图中可以看出,当目标域数据集为“相机1”和“相机2”时,算法TCBHN取得了最好的分类效果,TLAE算法分类效果居中;当目标域数据集为“手机”和“平板”时,算法MLP取得了最好的分类效果,TLAE算法相比于其他算法,也具有竞争力;当目标域数据集为“水果”和“衣服”时,TLAE算法取得了最佳分类性能。2.值对分类精度的影响将领域相关性分为高、低、中三个等级,图3-8表示了在不同算法中领域相关性对英文数据分类精度的影响,图3-9表示了在不同算法中领域相关性对中文数
第3章基于LPA的方面提取迁移学习算法29据分类精度的影响,从两图看出,当>70%,即领域相关性为“高”时,TLAE算法的分类精确度较低;当30%<70%,即领域相关性为“中”时,TLAE算法的分类精确度逐渐增高;当30%,即领域相关性为“低”时,TLAE算法的分类精确度最高。且从图中TLAE算法的线性趋势来看,随着领域相关性的下降,TLAE算法的分类效果逐渐优越,证明了TLAE算法在跨域迁移中的有效性。图3-8值对英文数据分类精度的影响图3-9值对中文数据分类精度的影响3.不同算法分类时间比较TLAE算法在计算时间上也是有利的,表3-7记录了不同算法在6组英文数据上的运行时间,表3-8记录了不同算法在6组中文数据上的运行时间,单位为秒。从两表可以看出,即使与NB等简单方法相比,TLAE算法在方面提取任务中的
【参考文献】:
期刊论文
[1]情感分析中的方面提取综述[J]. 陈苹,冯林. 计算机应用. 2018(S2)
[2]迁移学习研究综述[J]. 王惠. 电脑知识与技术. 2017(32)
[3]面向汽车评论的细粒度情感分析方法研究[J]. 陈炳丰,郝志峰,蔡瑞初,温雯,王丽娟,黄浩,蔡晓凤. 广东工业大学学报. 2017(03)
[4]基于语义约束LDA的商品特征和情感词提取[J]. 彭云,万常选,江腾蛟,刘德喜,刘喜平,廖国琼. 软件学报. 2017(03)
[5]基于半监督的SVM迁移学习文本分类算法[J]. 谭建平,刘波,肖燕珊. 无线互联科技. 2016(04)
[6]基于情感分析的企业产品级竞争对手识别研究——以用户评论为数据源[J]. 肖璐,陈果,刘继云. 图书情报工作. 2016(01)
[7]主题网络爬虫研究综述[J]. 刘金红,陆余良. 计算机应用研究. 2007(10)
博士论文
[1]观点挖掘中评价对象抽取方法的研究[D]. 刘倩.东南大学 2016
硕士论文
[1]基于迁移学习的情感分类研究与应用[D]. 段秀玉.北京邮电大学 2019
[2]基于半监督学习的观点挖掘算法的研究与实现[D]. 吴春叶.北京邮电大学 2019
[3]基于主题模型的无监督方面级观点挖掘算法研究[D]. 冯晋田.华中科技大学 2019
[4]一种实例迁移学习算法的改进研究[D]. 李毅.西北师范大学 2018
[5]基于SVM的文本情感分类研究及应用[D]. 陈志珍.大连海事大学 2017
[6]搜索引擎中通用爬虫系统的研究与设计[D]. 高龙.吉林大学 2013
[7]基于迁移学习的中文评论情感分类方法研究[D]. 马凤闸.大连理工大学 2012
[8]中文情感词汇本体的构建及其应用[D]. 陈建美.大连理工大学 2009
[9]基于实例和特征的迁移学习算法研究[D]. 戴文渊.上海交通大学 2009
本文编号:3026938
本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/3026938.html