当前位置:主页 > 管理论文 > 移动网络论文 >

面向话题型微博评论的观点识别及其情感倾向分析研究

发布时间:2017-04-16 18:12

  本文关键词:面向话题型微博评论的观点识别及其情感倾向分析研究,由笔耕文化传播整理发布。


【摘要】:随着互联网在中国的普及,人们的生活方式也逐渐地发生变化,越来越多的人通过互联网获取和发布信息。广大互联网用户开始在微博上传播政治话题、体育话题、娱乐话题。每天都有大量的具有分析价值的微博评论产生,这些评论信息包含大量情感信息和观点。 微博研究已经成为热点。通过对中文微博情感分析相关文献的研究,发现微博情感分类方法主要有两类:基于情感词典的方法和基于机器学习的方法。由于中文语法复杂,基于机器学习的方法无法保留了情感相关特征项之间的关系,也无法应对多个情感词和评价对象的情况。而基于情感词典的方法,在情感极性分类过程中,较少考虑到微博话题领域词汇,同时情感词典中的情感词不区分情感词之间情感强弱,这样使得分类结果的准确性受到影响。目前中文微博情感分析缺乏针对性研究,忽略评价对象对情感的极性和强弱影响,而且情感特征项抽取算法也有待改进。 针对这些问题,本文采用基于情感词典的方法,,选择中文情感词汇本体库作为本文的基础情感词典,有效地改进以往情感词典不区分情感之间情感强弱的缺点。并且采用一种基于HowNet的词汇语义相似度计算方法,构建面向微博话题的领域情感词典。同时考虑到评价对象对微博情感分类的影响,构建合理的评价对象词典。本文采用规则和SVM模型进行观点识别,筛选出和微博话题相关的微博评论,提高情感分析中评论文本的质量。然后对微博评论文本进行相应的文本预处理,并采用平滑算法、语法规则相结合,作为微博评论文本情感特征项抽取方法,对微博评论中的否定词、程度副词、微博表情符号、情感词以及评论中的评价对象做相应的处理。最后本文结合微博评论语句情感计算公式,对评论句的情感倾向进行分类,有效改进了以往微博情感分析的缺陷,实现了一个能够较为合理判断微博评论句情感强弱的计算公式。不同的话题,其领域词典存在不同。本文基于微博话题构建针对性的情感倾向词典和评价对象词典做特定话题的情感分析研究,可以进一步提升情感分析效果。 实验数据采用数据堂提供的微博语料,包含生活、交通事故、科技三个领域的微博话题评论数据,实验结果表明,本文设计的观点识别方法和情感分类模型与以往的分类模型对比,观点识别和情感分类效果具有明显提升,说明本文提出的方法具有合理性和有效性。
【关键词】:微博话题 观点识别 词汇相似度 情感词典 情感倾向
【学位授予单位】:杭州电子科技大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP391.1;TP393.092
【目录】:
  • 摘要5-6
  • ABSTRACT6-8
  • 目录8-11
  • 1 绪论11-20
  • 1.1 研究背景11-12
  • 1.2 研究目的及意义12-13
  • 1.3 微博国内外研究综述13-15
  • 1.3.1 国内微博情感分析研究现状13-14
  • 1.3.2 国外微博情感分析研究现状14-15
  • 1.4 观点识别研究综述15-16
  • 1.5 研究内容及挑战16-17
  • 1.6 研究框架17-19
  • 1.7 本章小结19-20
  • 2 相关介绍与理论概述20-31
  • 2.1 微博概述20-22
  • 2.1.1 微博定义及发展20
  • 2.1.2 微博特点及其成功原因20-21
  • 2.1.3 国内外微博比较21-22
  • 2.2 文本特征选择方法22-25
  • 2.2.1 特征选取及要点22
  • 2.2.2 目前常用的几种特征选择方法22-24
  • 2.2.3 目前文本特征提取的难点24-25
  • 2.2.4 微博研究特征选取方法25
  • 2.3 文本预处理25-30
  • 2.3.1 中文分词26-27
  • 2.3.2 中文分词难点总结27
  • 2.3.3 中文分词系统27-28
  • 2.3.4 词性标注28-30
  • 2.3.5 停用词过滤30
  • 2.4 本章小结30-31
  • 3 话题型微博相关情感词典构建31-43
  • 3.1 HowNet介绍31
  • 3.2 词语相似度与词语距离31-32
  • 3.2.1 词语相似度含义31
  • 3.2.2 词语相似度与词语距离的关系31-32
  • 3.3 情感词典相关介绍32-34
  • 3.3.1 情感相关术语介绍32-33
  • 3.3.2 情感词典的重要性33
  • 3.3.3 相关情感词典介绍33-34
  • 3.3.4 微博情感词典的组成34
  • 3.4 基础情感词典构建34-37
  • 3.5 程度副词、否定词词典构建37-38
  • 3.5.1 程度副词词典构建37
  • 3.5.2 否定词词典构建37-38
  • 3.6 表情符号、网络用语词典构建38
  • 3.6.1 表情符号词典构建38
  • 3.6.2 网络用语词典构建38
  • 3.7 评价对象词典构建38-39
  • 3.8 面向微博话题的领域情感词典构建39-42
  • 3.8.1 领域词汇获取40
  • 3.8.2 基于HowNet词汇语义相似度计算方法40-41
  • 3.8.3 领域情感词典构建41-42
  • 3.9 本章小结42-43
  • 4 话题型微博评论的观点识别及其情感倾向分析43-59
  • 4.1 微博情感相关特征项分析43-47
  • 4.1.1 话题型微博评论文本的特点43-44
  • 4.1.2 本文微博情感相关特征项44-47
  • 4.2 微博特征项抽取算法47-51
  • 4.2.1 情感词、程度副词、否定词、评价对象的抽取48-50
  • 4.2.2 表情符号的抽取50
  • 4.2.3 网络用语的抽取50-51
  • 4.3 话题型微博评论观点识别介绍51-54
  • 4.3.1 观点识别相关介绍51
  • 4.3.2 微博观点识别特征项选择51-52
  • 4.3.3 SVM介绍52-54
  • 4.4 基于规则和SVM相结合的观点句识别54-56
  • 4.4.1 观点识别过滤规则54-55
  • 4.4.2 基于SVM的观点识别55-56
  • 4.5 微博话题评论情感倾向计算56-57
  • 4.6 本章小结57-59
  • 5 实验及结果分析59-66
  • 5.1 实验及结果分析59
  • 5.2 实验的评价指标59-60
  • 5.2.1 准确率和召回率59
  • 5.2.2 F1 值59-60
  • 5.3 话题相关领域情感词扩展实验结果60
  • 5.4 观点识别实验结果60-61
  • 5.5 话题微博评论情感极性分类61-65
  • 5.6 本章小结65-66
  • 6 总结和展望66-68
  • 6.1 工作总结66
  • 6.2 不足与进一步改进66-68
  • 致谢68-69
  • 参考文献69-73
  • 附录73-86
  • 附录173-74
  • 附录274-86

【参考文献】

中国期刊全文数据库 前10条

1 王银;吴新玲;;中文微博情感分析方法研究[J];广东技术师范学院学报;2014年03期

2 王乐;闭应洲;;基于特征模板提取及SVM的观点句识别[J];广西师范学院学报(自然科学版);2014年03期

3 王晶;;论英语教学中的情感教育[J];黑龙江科技信息;2010年09期

4 卢苇;彭雅;;几种常用文本分类算法性能比较与分析[J];湖南大学学报(自然科学版);2007年06期

5 刘志明;刘鲁;;基于机器学习的中文微博情感分类实证研究[J];计算机工程与应用;2012年01期

6 柳位平;朱艳辉;栗春亮;向华政;文志强;;中文基础情感词词典构建方法研究[J];计算机应用;2009年10期

7 朱嫣岚;闵锦;周雅倩;黄萱菁;吴立德;;基于HowNet的词汇语义倾向计算[J];中文信息学报;2006年01期

8 王根;赵军;;基于多重冗余标记CRFs的句子情感分析研究[J];中文信息学报;2007年05期

9 徐琳宏;林鸿飞;赵晶;;情感语料库的构建和分析[J];中文信息学报;2008年01期

10 乔维;孙茂松;;汉语交集型歧义切分字段关于专业领域的统计特性[J];中文信息学报;2008年04期


  本文关键词:面向话题型微博评论的观点识别及其情感倾向分析研究,由笔耕文化传播整理发布。



本文编号:311377

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/ydhl/311377.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户d7548***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com