当前位置:主页 > 管理论文 > 移动网络论文 >

面向热点话题型微博的情感分析研究

发布时间:2022-01-04 02:07
  在信息技术高速发展的今天,用户需要面对大量的数据,海量数据中蕴含用户所需要的信息。微博作为一种新兴的互联网应用,正在高速地发展,由于用户众多,在微博上人们大量参与讨论的话题往往成为热点话题,用户针对话题发表的微博信息往往带有主观意味,本文以此为研究的出发点,为了获取在微博下用户对话题的舆情信息,对热点话题类微博的情感分析任务进行了研究,具体的研究包括以下几个方面:首先,分析了热点话题型微博的特点,讨论了有监督方法下,微博主客观分类、情感极性判别问题上分类器的选用以及特征的选择。通过实验发现在SVM分类器下,微博主客观分类问题通过结合文本特征与非文本特征,文本特征采用2选择,并利用微博的表情符,可以获得最优的性能。微博极性判别问题下结合词汇级特征、语句级特征和表情符特征可以取得最好的性能。实验结果证明了方法的有效性。其次,针对目前热点话题类微博下情感分析任务面临标注语料不足的问题。采用了半监督的策略,使用直推式支撑向量机(TSVM)的方法,结合大量未标注数据,在与有监督方法相同的特征组合下,微博主客观分类和情感极性判别的性能得到进一步提升,证明了方法的有效性。再次,研究了热点话题下微博评... 

【文章来源】:哈尔滨工业大学黑龙江省 211工程院校 985工程院校

【文章页数】:70 页

【学位级别】:硕士

【文章目录】:
摘要
Abstract
第1章 绪论
    1.1 课题背景及研究的目的和意义
    1.2 情感分析国内外研究现状
        1.2.1 情感分析相关定义
        1.2.2 情感分析的国内外研究现状
        1.2.3 相关评测
    1.3 微博情感分析与国内外研究现状
        1.3.1 微博情感分析的任务
        1.3.2 微博情感分析的国内外研究现状
    1.4 本文的主要内容及章节安排
第2章 有监督的微博主客观分析与极性判别
    2.1 引言
    2.2 相关任务的定义
        2.2.1 微博主客观的定义
        2.2.2 微博极性判别的定义
    2.3 微博语料的相关工作
        2.3.1 微博语料的简介
        2.3.2 微博语料的标注
        2.3.3 微博语料的特点
    2.4 其他相关资源的介绍与准备
    2.5 分类器的基本原理
        2.5.1 分类器的基本原理
        2.5.2 分类器的选取
    2.6 有监督的主客观识别及特征选取
        2.6.1 文本特征对分类的影响
        2.6.2 文本特征的实验结果
        2.6.3 表情符特征对分类的影响
        2.6.4 引入表情符特征的实验结果
    2.7 有监督的极性判别及特征选取
    2.8 本章小结
第3章 半监督的微博主客观分析与极性判别
    3.1 引言
    3.2 半监督的简介
        3.2.1 半监督的三种假设
        3.2.2 半监督的主要方法
    3.3 TSVM 基本原理
        3.3.1 TSVM 相关介绍
        3.3.2 本文使用的 TSVM
    3.4 基于 TSVM 的微博主客观分类
    3.5 基于 TSVM 的微博极性判别
    3.6 本章小结
第4章 微博评价对象的抽取与合并
    4.1 引言
    4.2 话题型微博评价对象的抽取工作
        4.2.1 微博评价对象抽取方法概述
        4.2.2 本文采用的微博评价对象抽取方法
        4.2.3 改进的抽取算法
    4.3 基于聚类的评价对象合并
        4.3.1 相似度的度量
        4.3.2 聚类方法的采用
        4.3.3 评价对象的归并算法
        4.3.4 实验与分析
    4.4 本章小结
第5章 热点话题微博情感分析系统设计与实现
    5.1 引言
    5.2 微博数据获取子系统
    5.3 热点话题微博情感分析子系统
        5.3.1 微博信息预处理模块
        5.3.2 特征提取模块
        5.3.3 微博主客观分类模块
        5.3.4 微博极性判别模块
        5.3.5 微博评价对象抽取模块
        5.3.6 微博评价对象聚类模块
    5.4 结果数据存储子系统
    5.5 结果可视化子系统
        5.5.1 微博舆情统计模块
        5.5.2 微博信息查询模块
    5.6 系统展示
    5.7 本章小结
结论
参考文献
致谢


【参考文献】:
期刊论文
[1]朴素贝叶斯在文本分类中的应用[J]. 熊志斌,刘冬.  软件导刊. 2013(02)
[2]中文微博情感分析中主客观句分类方法[J]. 杨武,宋静静,唐继强.  重庆理工大学学报(自然科学). 2013(01)
[3]基于层次结构的多策略中文微博情感分析和特征抽取[J]. 谢丽星,周明,孙茂松.  中文信息学报. 2012(01)
[4]基于浅层句法特征的评价对象抽取研究[J]. 徐冰,赵铁军,王山雨,郑德权.  自动化学报. 2011(10)
[5]评价对象抽取及其倾向性分析[J]. 刘鸿宇,赵妍妍,秦兵,刘挺.  中文信息学报. 2010(01)
[6]半监督学习研究进展[J]. 梁吉业,高嘉伟,常瑜.  山西大学学报(自然科学版). 2009(04)
[7]层次聚类算法的改进及分析[J]. 郭晓娟,刘晓霞,李晓玲.  计算机应用与软件. 2008(06)
[8]聚类算法研究[J]. 孙吉贵,刘杰,赵连宇.  软件学报. 2008(01)
[9]基于监督学习的中文情感分类技术比较研究[J]. 唐慧丰,谭松波,程学旗.  中文信息学报. 2007(06)
[10]情感词汇本体的构造[J]. 徐琳宏,林鸿飞,潘宇,任惠,陈建美.  情报学报. 2008 (02)



本文编号:3567438

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/ydhl/3567438.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户57aba***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com