融合知识的情感分析研究
本文关键词:融合知识的情感分析研究
【摘要】:情感分析是自然语言处理领域重要的研究方向之一,主要挖掘互联网用户对于事件、产品或者服务等所表达的情感倾向,其在舆情监控、市场决策等方面具有重要的应用价值。对情感分析的问题来说,人或多或少有一些常识性的知识。例如,我们知道“口味-不错”在餐馆的评论中频繁出现;“价格”和“性价比”在语义上都和价格相关等。如何在情感分析中引入这些显然的、易于获取的知识,从而促进和提高情感分析的性能至关重要。引入知识能够简化模型构建,一定程度上减少对标注数据的依赖,从而使得模型的泛化能力更强。因此,本文从融合知识的角度,对情感分析的若干问题深入分析研究,论文研究的主要内容有:?情感抽取,主要指评价词和评价对象的抽取。本文基于大量的评论数据,通过少量的“评价词-评价对象”搭配引入语法知识来实现情感抽取。其中,语法知识为有效的“评价词-评价对象”间频率较高的语法关系,这些语法关系是在大量数据中的统计得来,而不需要人工定义或标注数据。本文提出的方法充分利用了海量评论数据中丰富的语法关系,相比于现有的情感抽取方法具有明显的优势。?情感和维度分类,主要指评论篇章的情感倾向分类和评论中句子的维度分类。本文将句子级别维度的分类和篇章级别的情感分类形式化成一个有结构学习的问题,并且在模型的结构中引入少量的维度指示词。正是因为引入维度词汇知识,使得句子的维度分类不需要人工标注数据。而且,通过对句子维度和篇章情感同时建模,使得情感和维度分类的性能得到显著提高。?针对单篇评论的情感摘要,本文研究了单篇评论中句子内容重要性排序问题。由于评论中的每句话并不具有相同的重要性,本文提出从句子的文本内容和情感倾向两个方面对其重要性进行排序。其中,句子文本内容排序通过引入若干人工准则作为知识训练排序模型,不需要对句子重要性进行标注。?针对多篇评论的情感摘要,本文从用户需求和兴趣角度,研究个性化、定制化的评论摘要生成。本文提出在话题模型中引入情感和维度等语义知识,使得在不增加模型复杂度的同时对评论的情感和维度建模。本文的方法简单有效,并且在评论摘要生成时考虑用户的需求和兴趣,具有一定的应用前景。
【关键词】:情感分析 观点挖掘 知识 弱监督学习
【学位授予单位】:清华大学
【学位级别】:博士
【学位授予年份】:2015
【分类号】:TP391.1
【目录】:
- 摘要3-4
- Abstract4-9
- 第1章 引言9-25
- 1.1 研究背景9-10
- 1.2 研究现状10-22
- 1.2.1 情感抽取10-15
- 1.2.2 情感和维度分类15-19
- 1.2.3 情感摘要19-22
- 1.3 知识22-23
- 1.4 本文的研究重点23-25
- 第2章 融合语法知识的情感抽取25-43
- 2.1 概述25-26
- 2.2 情感抽取的框架26-27
- 2.3 符号表示27-28
- 2.4 评价对象-评价词表示28-29
- 2.5 弱监督学习29-34
- 2.5.1 广义期望准则29-30
- 2.5.2 正面标注特征(语法知识)30-31
- 2.5.3 类别稀疏正则项(Label Sparsity Regularization)31
- 2.5.4 训练二分类器31-33
- 2.5.5 Bootstrapping抽取框架33-34
- 2.6 实验34-42
- 2.6.1 数据集34-36
- 2.6.2 知识的引入36
- 2.6.3 评价方式36-37
- 2.6.4 参数设置37
- 2.6.5 评价对象评价词抽取案例研究37-38
- 2.6.6 评价词评价对象抽取的性能对比38-39
- 2.6.7 语法知识的敏感性评价39-40
- 2.6.8 参考分布的敏感性评价40
- 2.6.9 对最低可信分数阈值的敏感性评价40-41
- 2.6.10 实验小结41-42
- 2.7 本章小结42
- 附件42-43
- 第3章 融合词汇知识的情感和维度分类43-64
- 3.1 概述43-46
- 3.2 维度和情感解释的定义46
- 3.3 优化问题形式化定义46-47
- 3.4 通过损失函数引入维度词汇知识47-48
- 3.4.1 句子级别的损失函数(Sentence-level loss ,SL)47
- 3.4.2 篇章级别的损失函数(Document-level loss ,,DL)47-48
- 3.5 维度分类和篇章情感分类的联合建模48-49
- 3.5.1 评论篇章的情感倾向预测49
- 3.5.2 情感解释的维度划分49
- 3.6 模型训练49-51
- 3.6.1 优化问题49-51
- 3.6.2 模型和隐变量的初始化51
- 3.7 实验51-63
- 3.7.1 数据集51-53
- 3.7.2 评论篇章的情感倾向预测53-56
- 3.7.3 维度分析的案例研究56-57
- 3.7.4 量化分析57-63
- 3.8 本章小结63
- 附件63-64
- 第4章 融合规则知识的评论内容重要性分析64-77
- 4.1 概述64-65
- 4.2 排序与情感分析联合建模65-68
- 4.2.1 句子信息含量排序65-67
- 4.2.2 句子的情感分析67-68
- 4.3 联合优化68-71
- 4.3.1 对偶分解简介69-70
- 4.3.2 对偶分解求解联合优化问题70-71
- 4.3.3 句子重要程度排序71
- 4.4 实验71-76
- 4.4.1 数据71-72
- 4.4.2 评价指标72
- 4.4.3 对比方法72-73
- 4.4.4 总体排序对比73
- 4.4.5 重要句子排序性能评价73-76
- 4.5 本章小结76
- 附件76-77
- 第5章 融合语义知识的评论分析和摘要77-94
- 5.1 概述77-78
- 5.2 话题模型简介78-80
- 5.2.1 符号表示78-79
- 5.2.2 LDA训练与参数估计79-80
- 5.3 基于话题模型的评论建模80-84
- 5.3.1 融合语义知识的LDA模型81-82
- 5.3.2 引入维度、情感等语义知识82-83
- 5.3.3 引入评论的打分83-84
- 5.4 基于话题模型的用户兴趣建模84
- 5.5 基于话题模型的个性化摘要生成84-85
- 5.5.1 摘要的个性化84-85
- 5.5.2 摘要的结构化85
- 5.6 实验85-92
- 5.6.1 数据集和参数设置85-87
- 5.6.2 话题的解释性分析87-88
- 5.6.3 话题的质量分析88-89
- 5.6.4 个性化摘要生成分析89-92
- 5.7 本章小结92-94
- 第6章 总结与展望94-96
- 6.1 本文总结94-95
- 6.2 工作展望95-96
- 参考文献96-104
- 致谢104-106
- 个人简历、在学期间发表的学术论文与研究成果106-107
【相似文献】
中国期刊全文数据库 前10条
1 吕国防;;注意新闻表述中的情感倾向[J];新闻实践;2011年06期
2 傅向华;刘国;郭岩岩;郭武彪;;中文博客多方面话题情感分析研究[J];中文信息学报;2013年01期
3 魏晶晶;吴晓吟;;电子商务产品评论多级情感分析的研究与实现[J];软件;2013年09期
4 于潇;万军;何翔;左尾欢;;校园微博情感分析系统的设计与实现[J];河北工业大学学报;2013年06期
5 封二英;庞灵;;基于弱监督迭代法的情感倾向分析[J];无线互联科技;2014年03期
6 庞磊;李寿山;张慧;周国栋;;基于微博的股票投资者未来情感倾向识别研究[J];计算机科学;2012年S1期
7 徐鹏;;基于直觉模糊推理的网页在线评论情感倾向分类[J];计算机应用与软件;2013年06期
8 杨伟杰;马博渊;刘雯;;基于意见目标句抽取的中文股评情感分析方法[J];计算机仿真;2014年03期
9 杨江;彭石玉;侯敏;;基于主题情感句的汉语评论文倾向性分析[J];计算机应用研究;2011年02期
10 张素智;樊得强;李宝燕;;基于网络评论语言学结构的情感倾向识别模型[J];郑州大学学报(理学版);2011年01期
中国重要会议论文全文数据库 前4条
1 杨江;侯敏;王宁;;基于主题情感句的汉语评论文倾向性分析[A];第五届全国青年计算语言学研讨会论文集[C];2010年
2 林慧恩;林世平;;中文情感倾向分析中主观句子抽取方法的研究[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(上册)[C];2009年
3 王素格;杨安娜;;一种混合语言信息的词语搭配倾向判别方法[A];第五届全国信息检索学术会议论文集[C];2009年
4 宋晓雷;王素格;李红霞;;基于概率潜在语义分析的词汇情感倾向判别[A];第五届全国青年计算语言学研讨会论文集[C];2010年
中国重要报纸全文数据库 前3条
1 唐楠;新闻应避免情感倾向[N];中国新闻出版报;2005年
2 鲁东;不尽乡情入画来[N];中国文化报;2001年
3 杨勇涛;让摄影唤起心灵的本真[N];中国摄影报;2005年
中国博士学位论文全文数据库 前6条
1 房磊;融合知识的情感分析研究[D];清华大学;2015年
2 张奇;细颗粒度情感倾向分析若干关键问题研究[D];复旦大学;2008年
3 王素格;基于Web的评论文本情感分类问题研究[D];上海大学;2008年
4 杨卉;Web文本观点挖掘及隐含情感倾向的研究[D];吉林大学;2011年
5 李思;WEB观点挖掘中关键问题的研究[D];北京邮电大学;2012年
6 李方涛;基于产品评论的情感分析研究[D];清华大学;2011年
中国硕士学位论文全文数据库 前10条
1 王帅;情感分析的特征提取算法与观点的聚类算法研究[D];昆明理工大学;2015年
2 冯金刚;网络舆情中文信息情感倾向分析研究[D];华北电力大学;2015年
3 魏从源;网络信息的情感倾向分类技术研究[D];国防科学技术大学;2013年
4 周冬卫;中文微博评论的情感倾向分析[D];华东交通大学;2015年
5 吴斐;跨领域条件下词汇情感倾向判别方法研究[D];合肥工业大学;2015年
6 徐凯;基于产品特征的用户评论情感倾向分析研究[D];合肥工业大学;2015年
7 王格;网络评论的情感倾向分析[D];武汉工程大学;2015年
8 刘其;基于用户评论的群体情绪识别与演化研究[D];东华大学;2015年
9 张佳明;微博话题的公众情感分析技术研究[D];解放军信息工程大学;2015年
10 杨国峰;基于支持向量机的篇章情感倾向分析系统研究与实现[D];中山大学;2011年
本文编号:1042184
本文链接:https://www.wllwen.com/shoufeilunwen/xxkjbs/1042184.html