面向跨领域产品评论的情感分析研究
本文关键词:面向跨领域产品评论的情感分析研究
更多相关文章: 情感分类 跨领域 关联规则 超限学习机 动态卷积超限学习
【摘要】:伴随着信息技术的不断发展,越来越多的用户利用微博、产品评论、影视评论和用户反馈等形式表达其立场态度。这些评论以及反馈数据广泛涉及到包括书籍类、电脑类和化妆品类等众多领域,为企业提供了大量的用户态度倾向信息。实现用户态度倾向的自动判别有利于企业及时获取用户对产品的认可度,为进一步分析用户需求,实现个性化推荐提供依据。但常用的利用单一领域知识进行模型学习和识别的方法中,大量手工标定标签的需求与实际应用中样本数目不足、手工标定成本高等矛盾日渐突出。考虑到文本描述中用户情感表达的类似特点,有研究者开始探讨将已有领域训练的情感分析模型用于其他领域。然而现实问题中,由于人们在不同的领域中用不同的词来表达相同的情感,所以在某一领域训练得到的分类器不能直接应用到其他领域。因而研究和提出有效的跨领域情感极性分析方法具有重要的应用和研究价值。跨领域情感分析方法的关键在于降低领域之间差异,目前方法通常在实例、特征和模型三个层次探索领域自适应的解决方案。基于特征自适应的方法是通过特征表示传递将源领域和目标领域的语句映射到同一特征分布中,相对实例加权自适应方法,在更抽象层次建立领域词之间的映射关系。以无关词为桥梁的图谱特征对齐方法,不但可以减少领域差异,而且可以发掘出更鲁棒的特征。以该方法为基础,本文进一步探索了领域无关词与领域相关词的相关关系,研究并提出了基于关联规则的词对齐方法。同时探讨了深度学习方法在抽象特征学习中的优势,改进了基于深度学习的文本情感极性分析方法,进一步探索了基于模型层的领域自适应方法。在公共库上实践和验证了所提算法的有效性。本文主要工作和创新点包括:(1)提出了一种基于关联规则进行词对齐的方法来实现词语映射,提升了不同领域中表达相同情感的不同词语的对齐效果,为实现跨领域文本情感极性分析提供了基础。该方法使用无关词作为桥梁来减少领域间的差异,并对领域无关词与领域相关词之间的关联规则进行挖掘,利用强关联规则将不同领域中的领域相关词进行对齐进而将源领域和目标领域样本映射到同一特征分布中。在Amazon产品评论数据集上的实验结果表明,本文提出的方法在准确率、传递损失和传递率多个评价指标上优于现有的主流方法。(2)提出了一种动态卷积超限学习算法,将超限学习机(ELM)用于动态卷积神经网络中,改善了动态卷积神经网络在文本情感分类中的泛化能力,提高了文本情感极性分类效果。在充分利用卷积运算提取显著特征的基础上,利用超限学习机替代全连接层,实现对多层网络所提特征的分类。利用参数随机生成的扰动性能,降低分类端对训练样本的依赖,避免过拟合,提升分类性能。在公共数据集上的实验表明,本文提出的方法在准确率、F1测度等多个标准指标上均优于改进前的动态卷积神经网络以及若干改进ELM算法。(3)研究了动态卷积超限学习算法在跨领域情感分类中的特点,探讨了面向跨领域的动态卷积超限学习模型的改进和应用方法。在利用源领域带标签样本对深度网络模型进行参数学习的基础上,将全连接层前面的网络参数保留下来应用到目标领域数据的特征提取中。在模型中添加一层适应层,利用目标领域中少量带标签样本的文本特征向量对适应层进行训练。在Amazon产品评论数据集上的跨领域分类实验结果表明,本文模型的准确率优于一些无知识传递过程的相关算法,具备一定的领域自适应能力。
【关键词】:情感分类 跨领域 关联规则 超限学习机 动态卷积超限学习
【学位授予单位】:北京工业大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP391.1
【目录】:
- 摘要4-6
- Abstract6-11
- 第1章 绪论11-17
- 1.1 研究背景和意义11-12
- 1.2 国内外研究现状12-14
- 1.2.1 单领域情感分类12-13
- 1.2.2 跨领域情感分类13-14
- 1.3 本文主要研究内容14-15
- 1.4 本文章节安排15-17
- 第2章 文本情感分类方法概述17-37
- 2.1 引言17-18
- 2.2 文本表示18-24
- 2.2.1 文本预处理18-20
- 2.2.2 特征选择20-22
- 2.2.3 文本表示模型22-24
- 2.3 基于浅层学习的跨领域情感分类24-31
- 2.3.1 非负矩阵分解24-26
- 2.3.2 谱聚类26
- 2.3.3 关联规则26-27
- 2.3.4 常用分类器27-31
- 2.4 基于深度学习的跨领域情感分类31-36
- 2.4.1 深度信念网31-32
- 2.4.2 堆叠去噪自动编码机32-33
- 2.4.3 动态卷积神经网络33-36
- 2.5 本章小结36-37
- 第3章 基于关联规则进行词对齐的跨领域情感分类算法37-51
- 3.1 引言37
- 3.2 基于关联规则进行词对齐的跨领域情感分类算法37-42
- 3.2.1 强关联规则挖掘38-39
- 3.2.2 相关词对齐39-42
- 3.3 实验结果与分析42-49
- 3.3.1 数据集概述42-43
- 3.3.2 实验结果43-45
- 3.3.3 参数分析45-49
- 3.4 本章小结49-51
- 第4章 基于动态卷积超限学习的情感分类算法51-63
- 4.1 引言51
- 4.2 超限学习机51-52
- 4.3 动态卷积超限学习算法52-54
- 4.3.1 词向量表示52-53
- 4.3.2 特征提取53-54
- 4.3.3 分类器训练54
- 4.4 评论数据集与评价标准54-56
- 4.4.1 数据集概述54-55
- 4.4.2 评价标准55-56
- 4.5 实验结果与分析56-61
- 4.5.1 DCELM的对比实验56-59
- 4.5.2 参数分析59-61
- 4.6 本章小结61-63
- 第5章 跨领域动态卷积超限学习模型63-71
- 5.1 引言63
- 5.2 跨领域动态卷积超限学习模型63-65
- 5.2.1 参数训练63-64
- 5.2.2 参数传递64-65
- 5.3 实验结果与分析65-69
- 5.3.1 数据集概述65
- 5.3.2 实验结果65-67
- 5.3.3 参数分析67-69
- 5.4 本章小结69-71
- 结论71-73
- 参考文献73-77
- 攻读硕士学位期间发表的学术论文77-79
- 致谢79
【相似文献】
中国期刊全文数据库 前10条
1 刘宜学;“型”与“形”及相关词辨析[J];科技与出版;1998年04期
2 张选平;马琮;蒋宇;袁明轩;梁平;;一种基于概念抽取的相关词推荐模型[J];微电子学与计算机;2006年05期
3 章成志;苏兰芳;苏新宁;;基于多语境的相关词自动提取系统的设计与实现[J];现代图书情报技术;2006年09期
4 刘建舟;邵雄凯;;面向信息检索的相关词抽取[J];信息系统工程;2012年01期
5 ;联机解疑[J];情报理论与实践;1987年01期
6 章成志;徐小琴;;信息检索系统的相关词提示技术与评测[J];情报理论与实践;2007年01期
7 沈阳;朱婵元;周子轩;;相关词句采集与分析研究[J];图书情报工作;2009年22期
8 王云;查找同义词和相关词的定义衍生法[J];情报理论与实践;1996年05期
9 ;关于Internet的汉语定名及相关词的推荐名[J];中国信息导报;1997年08期
10 程华;智能ABC输入法技巧两则[J];电子与电脑;2001年07期
中国重要会议论文全文数据库 前1条
1 章成志;苏兰芳;;基于多语境的相关词自动提取[A];第三届学生计算语言学研讨会论文集[C];2006年
中国硕士学位论文全文数据库 前2条
1 李宁;面向跨领域产品评论的情感分析研究[D];北京工业大学;2016年
2 高配芝;基于相关词识别的数据库全文检索研究[D];山东大学;2014年
,本文编号:1110440
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1110440.html