面向中文微博的观点挖掘与倾向性分析研究

发布时间:2020-07-25 17:15
【摘要】:随着互联网的飞速发展,特别是Web2.0技术的逐渐普及,广大网络用户已经从过去单纯的信息获取者变为网络内容的主要制造者。尤其是自2009年中文微博诞生以来,用户使用互联网的习惯随之改变,从而带来了许多新的研究问题,其中中文微博的观点挖掘与倾向性分析技术渐渐成为许多专家学者的研究热点,获得了越来越多的关注。同时,随着自然语言处理技术、机器学习技术和大数据技术的不断发展和成熟,再次将中文微博的观点挖掘与倾向性分析研究推向高潮。中文微博平台的出现催生了许多新的应用需求,比如微博内容中评价对象抽取及其情感倾向性判定、微博内容的观点倾向性分析、查询主题相关的观点信息检索结果等。然而,由于中文微博的诸多特性,比如内容短、口语化严重、书写不规范、语句结构杂乱、带有转发关系等,使得传统的观点挖掘与倾向性分析技术已经不能完全满足对微博数据处理的需求。因此,本文针对这种新的应用需求,重点研究面向中文微博的情感词情感强度量化计算、序列化评价搭配联合抽取、观点倾向性判定以及观点检索等观点挖掘与倾向性分析关键技术,探索新的、适合中文微博的研究思路和方法,进一步提高观点挖掘与倾向性分析的准确性和实用性。论文的主要研究内容和创新成果包括以下四个部分:(1)通过分析情感词的情感强度模糊性特点,研究情感词的情感强度量化技术。基于情感词分类思想,提出基于正态分布的基础情感词情感强度量化计算方法和基于组词分类的复合情感词情感强度量化计算方法,实验结果表明,本文方法较大地提高了不同组词类型情感词的情感强度量化计算性能,计算结果更加贴近人们的主观判定。(2)通过分析中文微博评价对象与评价词语的特点,研究评价对象与评价词语的序列化评价搭配联合抽取技术。利用评价对象和评价词语的词法、句法、语义以及位置等特征,提出基于多特征的序列化评价搭配联合抽取方法。创新性地利用微博转发关系特性,提出基于转发关系的隐性评价搭配联合抽取方法。实验结果表明,评价搭配识别性能得到了较好的提升。(3)中文微博的诸多特性使其观点倾向性分析存在诸多难点。针对微博数据表达观点的情感搭配特点,构建情感搭配规则,提出基于情感搭配规则的微博观点倾向性判定方法。同时结合微博的其它诸多特性,进一步提出多特征融合的支持向量机观点倾向性判定方法,并利用微博转发关系特性和松弛标记技术对其判定结果进行优化计算,较大程度地提升了微博观点倾向性判定性能。(4)设计实现了一个面向中文微博的观点检索系统,该系统有机集成了情感强度量化技术、评价搭配抽取技术和观点倾向性判定技术,实现了系统内部核心功能模块的集成和检索结果的友好可视化展示,并初步应用于某部某项目之中,使研究成果更好地与实际应用相结合。
【学位授予单位】:北京理工大学
【学位级别】:博士
【学位授予年份】:2015
【分类号】:TP391.1

【共引文献】

相关期刊论文 前10条

1 龙珑;邓伟;元昌安;;绿色网络博客评论系统的提取方法[J];桂林理工大学学报;2014年01期

2 陆浩;牛振东;张楠;孙星恺;刘文礼;;基于句法与主题扩展的中文微博情感倾向性分析模型[J];北京理工大学学报;2014年08期

3 杨桂芳;;网络评论挖掘关键技术与方法研究概述[J];计算机光盘软件与应用;2014年22期

4 肖江;丁星;何荣杰;;基于领域情感词典的中文微博情感分析[J];电子设计工程;2015年12期

5 任远;巢文涵;周庆;李舟军;;基于话题自适应的中文微博情感分析[J];计算机科学;2013年11期

6 王昌厚;王菲;;使用基于模式的Bootstrapping方法抽取情感词[J];计算机工程与应用;2014年01期

7 李毅;胡金凤;王正友;;一种面向中文依赖语法的观点挖掘模型[J];河北省科学院学报;2014年02期

8 周咏梅;阳爱民;杨佳能;;一种新闻评论情感词典的构建方法[J];计算机科学;2014年08期

9 黄卫春;周冬卫;钟茂生;熊李艳;;一种改进的词汇语义极性分析算法[J];科学技术与工程;2014年24期

10 卢伟胜;郭躬德;陈黎飞;;基于词性标注序列特征提取的微博情感分类[J];计算机应用;2014年10期

相关会议论文 前1条

1 余传明;陈雷;张小青;;基于支持向量机的产品属性识别研究[A];国家自然科学基金委员会管理科学部宏观管理与政策学科青年基金获得者交流研讨会论文集[C];2010年

相关博士学位论文 前10条

1 崔亮;投资者情绪的统计测评及其应用研究[D];西南财经大学;2013年

2 邓莎莎;支持决策研讨的文本分析方法研究[D];上海交通大学;2013年

3 刘楠;面向微博短文本的情感分析研究[D];武汉大学;2013年

4 杨玉珍;基于Web评论信息的倾向性分析关键技术研究[D];山东师范大学;2014年

5 黄焕;面向e-Learning的学习者情感建模及应用研究[D];华中师范大学;2014年

6 布占廷;英汉语言学书评语篇中的负面评价对比研究[D];山东大学;2014年

7 边海容;Web信息驱动的上市公司财务危机预警研究[D];江西财经大学;2013年

8 杨东辉;基于情感相似度的社会化推荐系统研究[D];哈尔滨工业大学;2014年

9 韩闻文;基于社会化媒体的观点和行为挖掘研究[D];北京邮电大学;2014年

10 纪雪梅;特定事件情境下中文微博用户情感挖掘与传播研究[D];南开大学;2014年

相关硕士学位论文 前10条

1 薛宾;基于评价搭配的产品情感倾向聚类方法研究[D];山西大学;2013年

2 许斌;中文微博的情感分析和影响力技术研究[D];解放军信息工程大学;2013年

3 唐都钰;领域自适应的中文情感分析词典构建研究[D];哈尔滨工业大学;2012年

4 熊祖涛;基于Web文本信息抽取的微博舆情分析[D];西安科技大学;2013年

5 王静;突发事件网络舆情的情感倾向及演化分析[D];哈尔滨工业大学;2012年

6 张超;微博客话题评论的聚类分析[D];哈尔滨工业大学;2012年

7 季佳;媒体信息内容与中国股市中的股票收益的关系[D];哈尔滨工业大学;2013年

8 于帅;中文Web文本情感倾向性分析技术的研究[D];哈尔滨工程大学;2013年

9 王世东;基于数据挖掘的电子商务推荐系统设计与实现[D];电子科技大学;2013年

10 胡霖;个人文献服务平台研究与实现[D];中南大学;2013年



本文编号:2770121

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/xxkjbs/2770121.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户6f9d3***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com