情感分析中的方面类别识别研究
发布时间:2017-05-07 06:00
本文关键词:情感分析中的方面类别识别研究,由笔耕文化传播整理发布。
【摘要】:传统的情感分析目标是判断一段给定文本的情感极性,其研究对象是不同层次的文本,比如文档和句子。与之不同,方面级情感分析研究“意见”本身。一个方面级情感分析系统首先要识别出一个句子里评价了产品的哪些方面,比如笔记本电脑的电池、操作性能、价格等等,然后分析句子中对这些方面是正面还是负面的情感倾向。方面识别是方面级情感分析的基础。关于方面识别已经有了大量而细致的研究。在已有的方面级情感分析方法中,研究者通常试图直接从文本中抽取或识别一些可以代表产品属性或者产品的某些部分的名次或者名词短语来表示方法。这样的方法有两个问题。第一,不同的名词可能表示着同一个方面,比如“显示器”和“屏幕”都是一台电脑的同一个方面,直接用文本中提到的不同词语来代替不同的方面会造成困扰。第二,在一些语境中,人们评论某些方面是常常不显式地提及相应的名词。比如,当用户评论“太贵了”的时候,我们知道他/她说的一定产品的价格,但是“价格”或者“价钱”这样词眼并没有显式地出现。为了克服这样的问题,人们提出了基于预定义方面类别的方面级情感分析框架。在这个框架中,首先基于人的认识为某种特定产品预先定义一些方面类别,再去分析一段文本谈论了其中哪些方面。然而,一个复杂的长句常常表达多个意见,句子中的不同部分对应着不同的方面类别。意识到这一点可以帮助我们更好地识别句中的方面类别。现有的工作中没有考虑到这一点。本文尝试从两个角度来解决这个问题。首先,我们提出了基于机器翻译的方面级情感分析方法。这个方法是,把方面级情感分析看作是一个从自然语言句子到一种人工语言句子的翻译过程。这样,利用词对齐模型,我们可以捕捉到句子的不同文本片段和不同方面的对应关系。其次,我们进一步发现,不同的方面经常是分布在句子的并列结构中。基于这样的观察,我们试图把句子分割成多个子句,而子句是语法上可以表达一个完整命题的最小单元。这样,一个子句所表达的意见就更少,也更容易识别。另一方面,我们探索了利用文本的不同视角表示来提高方面识别的精度。我们为方面类别识别提出了一个多视角多示例多标签分类的框架。在这个框架中,可以从不同的视角来表示一段文本,不同的视角会带来互补的信息。同时,长句会被分割长多个子句。最后我们提出了一个算法叫做“协作迁移学习”算法,来解决这个多视角多示例多标签问题。我们在笔记本电脑领域和餐馆领域的两个数据集上实验了所提出的方法,在方面类别识别上,发现所提的方法比现有的方法有更高的识别性能。
【关键词】:方面级情感分析 方面类别识别 多视角 多示例 多标签
【学位授予单位】:南京大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP391.1
【目录】:
- 摘要4-6
- Abstract6-14
- 1 绪论14-18
- 1.1 研究背景14-16
- 1.2 本文的主要工作16-17
- 1.3 论文的内容安排17-18
- 2 相关工作18-34
- 2.1 引言18
- 2.2 文档级和句子级情感分析18-21
- 2.2.1 传统机器学习方法19
- 2.2.2 基于神经网络的方法19-21
- 2.3 方面级情感分析21-33
- 2.3.1 语料级别的评价目标和情感词抽取22-27
- 2.3.2 句子级别的评价目标和情感词识别27-29
- 2.3.3 基于话题模型的多方面情感分析29-30
- 2.3.4 基于预定义方面类别的多方面情感分析30-33
- 2.4 本章小结33-34
- 3 基于机器翻译的方面级情感分析34-42
- 3.1 引言34-35
- 3.2 方法流程35-36
- 3.3 目标语言的构造36-37
- 3.4 译文后处理37
- 3.5 实验37-40
- 3.5.1 基线方法37
- 3.5.2 数据集37-39
- 3.5.3 实验相关配置39
- 3.5.4 实验结果和分析39-40
- 3.6 本章小结40-42
- 4 引入翻译特征的方面识别42-54
- 4.1 引言42-43
- 4.2 多标签分类43-44
- 4.3 基于机器翻译的特征44-48
- 4.3.1 词对齐特征44-47
- 4.3.2 翻译短语特征47-48
- 4.4 实验48-52
- 4.4.1 实验数据集48-49
- 4.4.2 实验方法和实验结果49-51
- 4.4.3 和现有方法的比较51-52
- 4.5 本章小结52-54
- 5 基于多视角多示例多标签学习的方面识别54-64
- 5.1 引言54-55
- 5.2 句子的多示例表示55
- 5.3 文本的多视角表示55-57
- 5.3.1 基于特征的视角56
- 5.3.2 分布式文本表示视角56-57
- 5.3.3 多视角的结合57
- 5.4 多视角多示例多标签学习框架57-58
- 5.5 协作迁移学习58-60
- 5.6 实验60-62
- 5.6.1 实验设置60-61
- 5.6.2 实验结果和分析61-62
- 5.7 本章小结62-64
- 6 总结和展望64-65
- 参考文献65-71
- 致谢71-72
- 简历与科研成果72-73
【相似文献】
中国期刊全文数据库 前2条
1 姜莉莉;李彦;李文强;熊艳;;基于多视角的产品概念设计表达模型[J];计算机集成制造系统;2014年05期
2 ;[J];;年期
中国重要会议论文全文数据库 前1条
1 王宇石;杨立瑞;孔维武;;用多视角X射线安检技术探测爆炸物[A];全国危险物质与安全应急技术研讨会论文集(上)[C];2011年
中国硕士学位论文全文数据库 前1条
1 黄家君;情感分析中的方面类别识别研究[D];南京大学;2016年
本文关键词:情感分析中的方面类别识别研究,由笔耕文化传播整理发布。
,本文编号:349265
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/349265.html