微博情绪分类的关键技术研究
发布时间:2017-09-20 17:43
本文关键词:微博情绪分类的关键技术研究
【摘要】:近几年来,随着网络走进千家万户,越来越多的人从之前的单纯从互联网中获取信息,渐渐地转化为利用网络发布与共享信息。这个过程中,微博,作为当今社交网络平台的主力军之一,在人们日常生活中起到的作用不可小觑。微博在吸引大量活跃用户的同时,微博作为大数据的代表,也引起了不少学者的青睐。新浪微博日均千万的数据量中夹杂着网民对各种话题的各式各样的情绪。如果合理地对这些数据进行情感分析与事件主题分析,那么在舆情分析、危机公关、互联网营销分析和企业竞争情报挖掘等方面都大有裨益。本文旨在对现有情感分类与话题抽取方法进行归纳总结,通过大量实验分析,最终得出一套面向中文微博情绪分类与话题抽取的最优算法。为此,本文从如下三个方面对此任务做了深入研究。传统的情感分类方法研究部分,本文借鉴与优化了现有优秀情感分类算法,对基于词典规则的情绪分类、基于机器学习的情绪分类和启发式情绪判断规则的自动构建三方面工作进行了调研与实验。根据相关实验的分析,证明了该情绪分类算法可以有效提升现有模型在中文微博情绪分类任务中的分类效果。新兴的情感分类技术的融合方法研究部分,针对当前算法存在的分类盲区,本文提出了与主题模型、主动学习方法之间的融合的情感分类方法和与词汇向量化表示、神经网络模型融合的情感分类算法,最终通过均衡分类效果与分类效率,选择性地将相关方法融入到了现有的情绪分类系统中。微博事件情感分布的原因分析的研究部分,本文从真实实验场景中存在的情绪分布不同的现象引入问题,针对性地提出了一套关键话题自动挖掘算法和半监督的微博话题纠正算法,实现了聚类算法与分类算法的互补,充分挖掘了话题对应的微博及情绪信息。最终,本文通过对海量、实时的新浪微博进行基于社会热点事件的情绪分类,最终搭建了“网民情绪监控”和“社会热点事件追踪”平台——微博情绪指数系统。本平台自上线以来,稳定运行的同时,其展示效果也广受好评。
【关键词】:中文微博 情绪分类 话题抽取
【学位授予单位】:哈尔滨工业大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP391.1
【目录】:
- 摘要4-5
- Abstract5-10
- 第1章 绪论10-26
- 1.1 课题来源10-11
- 1.2 研究目的和意义11-13
- 1.3 国内外相关研究13-23
- 1.3.1 情感分类概念简介13-14
- 1.3.2 传统的情感分类方法14-17
- 1.3.3 新兴的情感分类方法17-21
- 1.3.4 面向微博的话题抽取21-23
- 1.4 本文研究内容23-26
- 1.4.1 传统的情感分类方法研究24
- 1.4.2 新兴的情感分类技术的融合24
- 1.4.3 微博事件情感分布的原因分析24-25
- 1.4.4 微博情绪指数系统展示25-26
- 第2章 传统的情感分类方法研究26-36
- 2.1 引言26
- 2.2 无监督的基于词典规则的情绪分类26-28
- 2.2.1 词典资源收集26-28
- 2.2.2 算法流程设计28
- 2.3 有监督的基于特征抽取的情绪分类28-30
- 2.3.1 特征模板设计29
- 2.3.2 特征工程建设29-30
- 2.4 启发式情绪判断规则的自动构建30-32
- 2.4.1 算法设计31-32
- 2.4.2 构建结果举例32
- 2.5 实验语料32-33
- 2.6 评价指标33-34
- 2.7 实验结果34
- 2.8 本章小结34-36
- 第3章 新兴的情感分类技术的融合36-49
- 3.1 引言36-37
- 3.2 与主题模型之间的融合37-39
- 3.2.1 算法设计37-38
- 3.2.2 实验结果及分析38-39
- 3.3 与主动学习方法之间的融合39-40
- 3.3.1 算法设计39-40
- 3.4 与词汇向量化表示之间的融合40-44
- 3.4.1 算法介绍41-42
- 3.4.2 词向量训练42-43
- 3.4.3 实验结果43-44
- 3.5 与神经网络模型之间的融合44-47
- 3.5.1 算法介绍44-46
- 3.5.2 模型调优46
- 3.5.3 实验设置46-47
- 3.5.4 实验结果47
- 3.6 本章小结47-49
- 第4章 微博事件情感分布的原因分析49-59
- 4.1 引言49-50
- 4.2 算法设计50
- 4.3 微博关键话题挖掘算法50-54
- 4.3.1 问题分析50-51
- 4.3.2 事件话题的聚类算法设计51-52
- 4.3.3 事件话题热度排序算法设计52
- 4.3.4 实验数据52-53
- 4.3.5 评价方法53
- 4.3.6 实验结果与分析53-54
- 4.4 微博话题纠正算法54-57
- 4.4.1 问题分析54
- 4.4.2 算法设计54-56
- 4.4.3 评价方法56
- 4.4.4 实验结果与分析56-57
- 4.5 情感分布的原因分析57-58
- 4.6 本章小结58-59
- 第5章 微博情绪指数系统59-64
- 5.1 系统整体架构与功能介绍59-61
- 5.2 微博情绪分类模块设计61-62
- 5.3 微博热点事件话题分析模块设计62-63
- 5.4 本章小结63-64
- 结论64-66
- 参考文献66-73
- 攻读学位期间发表的学术论文73-75
- 致谢75-76
【相似文献】
中国期刊全文数据库 前10条
1 郭飞飞;王小华;谌志群;王荣波;;基于回应消息的中文微博情感分类方法[J];杭州电子科技大学学报;2013年06期
2 李赫元;俞晓明;刘悦;程学旗;程工;;中文微博客的垃圾用户检测[J];中文信息学报;2014年03期
3 文坤梅;徐帅;李瑞轩;辜希武;李玉华;;微博及中文微博信息处理研究综述[J];中文信息学报;2012年06期
4 王银;吴新玲;;中文微博情感分析方法研究[J];广东技术师范学院学报;2014年03期
5 肖s,
本文编号:889488
本文链接:https://www.wllwen.com/guanlilunwen/yingxiaoguanlilunwen/889488.html