面向话题型微博的热点事件情感分析研究
本文关键词:面向话题型微博的热点事件情感分析研究
更多相关文章: 热点事件话题微博 情感分析 评价对象抽取 情感词典
【摘要】:随着国内微博的快速发展,国内舆论几乎都在微博形成热点并引起广泛的讨论和强烈的反响,微博已经逐渐成为了一个重要的实时信息源和舆论传播中心。在热点事件发生之后,人们往往通过微博第一时间获取事件信息,并在微博上参与讨论,从而产生一些热门话题,对话题下的用户所发表的相关微博的信息进行挖掘和分析,可以帮助我们探究事件发生后群众的情感和关注变化,这对政府掌握和监控突发事件后的社会公众心理变化情况有着非常重要的意义。为了获取微博热点话题事件的舆情演化情况,本文针对新浪微博热门事件话题“女司机惨遭男司机暴打”中的评论文本进行情感分析和舆情追踪,基于情感词典和CRF模型多特征组合的方法进行话题型微博情感极性分类,对比不同特征组合下,情感极性分类的效果。基于规则和句法依存分析相结合的方法挖掘热点话题下微博评价对象。针对抽取的评价对象存在含义相似、形式不同的问题,本文还进行了聚类研究,从而挖掘出用户对热点事件的多个关注点,呈现出更好的微博关注点分布,最终实现对热门话题微博的舆情演化分析。主要研究包括以下几个方面:(1)对微博文本区别于传统文本的特点进行了研究,分析几种后期研究可能使用的微博文本特征,并介绍了微博情感分类相关技术、目前情感分析的研究现状,以及情感分析相关的国内外评测会议。(2)构造了中文微博情感词典,以知网情感词典、台湾大学情感词典和大连理工情感词汇本体为基础构造情感词典,并对基础情感词典进行基于《同义词词林扩展版》的同义词扩展。另外,还对情感词典进行网络新词、表情符号、程度副词以及连词的扩展。(3)以构建的情感词典为基础,本文采用基于CRF模型多特征组合的情感分析方法对话题型微博进行情感极性分类,选用四种文本特征,包括词、词性、情感词极性和否定词,并采取不同的特征组合,通过多组实验进行对比,获得使情感分类效果最优的特征组合。(4)微博热点事件话题下,不同用户往往对同一事件有着不同的关注点和不同的评价对象,因此本文进行了如何抽取话题类微博的评价对象的相关研究。通过分析发现热点话题下的微博评价对象多为名词、名词短语以及微博的话题标签,因此本文将潜在评价对象限定为名词或名词短语,首先基于汉语名词短语的定义抽取潜在评价对象。之后采用了基于规则和句法依存分析相结合的方法提取情感词,评价对象二元关系词对过滤潜在评价对象,抽取实际评价对象。针对评价对象抽取结果表达形式多样的问题,本文基于聚类对评价对象进行合并,提炼出话题的评价角度,从而挖掘出用户对热点事件的多个关注点,呈现出更好的微博关注点分布。同时针对这些关注点进行情感追踪,了解舆论情感的变化情况。(5)本文采用的实验数据集为新浪微博热门话题“女司机惨遭男司机暴打”下的微博评论,是通过新浪API爬取的连续5天的微博数据。
【关键词】:热点事件话题微博 情感分析 评价对象抽取 情感词典
【学位授予单位】:安徽大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP391.1
【目录】:
- 摘要3-5
- Abstract5-9
- 第一章 绪论9-16
- 1.1 研究背景与意义9-12
- 1.2 国内外研究现状12-14
- 1.2.1 基于情感词典的情感分类12-13
- 1.2.2 基于机器学习的情感分类13
- 1.2.3 微博短文本情感分类的研究现状13-14
- 1.3 本文的主要研究内容和章节安排14-16
- 1.3.1 本文的主要研究内容14-15
- 1.3.2 论文章节安排15-16
- 第二章 微博文本特点及情感分类基础研究16-26
- 2.1 微博文本特性概述16-17
- 2.2 微博文本的特征分析17-19
- 2.3 文本情感分类基础研究19-25
- 2.3.1 文本分词19-20
- 2.3.2 文本表示技术20-21
- 2.3.3 特征选择21-23
- 2.3.4 文本情感分类器23-25
- 2.4 本章小结25-26
- 第三章 中文微博情感分析研究概述26-31
- 3.1 情感分析的研究任务26-28
- 3.1.1 微博的主客观分类26
- 3.1.2 微博的情感倾向分析26-28
- 3.2 常用的情感分析方法28-29
- 3.2.1 基于情感词典的方法28
- 3.2.2 基于机器学习的方法28-29
- 3.2.3 基于语义规则的方法29
- 3.3 情感分析的相关评测29-30
- 3.4 本章小结30-31
- 第四章 基于情感词典和CRF多特征组合的话题微博情感分析31-43
- 4.1 构建中文微博情感词典31-36
- 4.1.1 基础情感词典31-32
- 4.1.2 基于《同义词词林扩展版》的情感词扩展32-33
- 4.1.3 微博表情符号扩展33
- 4.1.4 网络新词扩展33-34
- 4.1.5 领域词典34
- 4.1.6 程度副词词典34-35
- 4.1.7 否定词词典35
- 4.1.8 转折连词词典35-36
- 4.2 基于CRF多特征组合的情感极性分类36-39
- 4.2.1 CRF模型基本原理36-37
- 4.2.2 特征选择37-38
- 4.2.3 特征模板38-39
- 4.3 实验与分析39-42
- 4.3.1 实验数据与实验设置39-40
- 4.3.2 评估指标40
- 4.3.3 实验结果分析40-42
- 4.4 本章小结42-43
- 第五章 微博热点话题事件的公众舆情分析43-61
- 5.1 引言43
- 5.2 热点事件话题微博评价对象的抽取43-51
- 5.2.1 抽取潜在情感评价对象45-46
- 5.2.2 基于规则和句法关系二元组提取实际评价对象46-49
- 5.2.3 实验数据49
- 5.2.4 实验结果49-51
- 5.3 基于聚类的热点事件话题微博评价对象归并51-57
- 5.3.1 词语相似度计算52-54
- 5.3.2 评价对象的聚类研究54-55
- 5.3.3 实验设置55-56
- 5.3.4 实验结果对比分析56-57
- 5.4 评价对象情感趋势分析57-60
- 5.5 本章小结60-61
- 第六章 总结与展望61-63
- 6.1 本文总结61-62
- 6.3 工作展望62-63
- 参考文献63-68
- 致谢68
【参考文献】
中国期刊全文数据库 前10条
1 袁媛;;情感分析研究综述[J];信息与电脑(理论版);2015年21期
2 何炎祥;牛菲菲;方文其;陈强;孙松涛;;基于词性组合规则改进的中文句子极性判断方法[J];计算机应用与软件;2015年03期
3 张盛;李芳;;基于迭代两步CRF模型的评价对象与极性抽取研究[J];中文信息学报;2015年01期
4 李婷婷;姬东鸿;;基于SVM和CRF多特征组合的微博情感分析[J];计算机应用研究;2015年04期
5 潘艳茜;姚天f ;;微博汽车领域中用户观点句识别方法的研究[J];中文信息学报;2014年05期
6 王昊;杨亮;林鸿飞;;日本地震的微博热点事件分析[J];中文信息学报;2012年05期
7 庞磊;李寿山;周国栋;;基于情绪知识的中文微博情感分类方法[J];计算机工程;2012年13期
8 宋双永;李秋丹;路冬媛;;面向微博客的热点事件情感分析方法[J];计算机科学;2012年S1期
9 谢丽星;周明;孙茂松;;基于层次结构的多策略中文微博情感分析和特征抽取[J];中文信息学报;2012年01期
10 田久乐;赵蔚;;基于同义词词林的词语相似度计算方法[J];吉林大学学报(信息科学版);2010年06期
中国博士学位论文全文数据库 前2条
1 刘楠;面向微博短文本的情感分析研究[D];武汉大学;2013年
2 崔安颀;微博热点事件的公众情感分析研究[D];清华大学;2013年
中国硕士学位论文全文数据库 前4条
1 沈磊;基于规则与机器学习方法的中文微博情感分析研究[D];安徽大学;2015年
2 张想;面向热点话题型微博的情感分析研究[D];哈尔滨工业大学;2013年
3 徐帅;基于中文微博的情感分析研究[D];华中科技大学;2013年
4 朱洪;面向互联网中文舆情信息的情感倾向分析[D];国防科学技术大学;2011年
,本文编号:878900
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/878900.html