基于情感倾向性的网络舆情分析及演化预测研究
本文关键词:基于情感倾向性的网络舆情分析及演化预测研究,,由笔耕文化传播整理发布。
【摘要】:近年来,互联网社交工具的快速普及对我国社会产生了巨大的影响,并成为人们了解世界、交换意见的重要平台。在网络技术发展的同时,互联网和社会舆情逐渐融合,于是便产生了网络舆情的概念,网络舆情能够真实、快速的反映社会舆论,尤其是最近几年社交平台的迅速崛起,网络舆情在很大程度上引导着认识的基本认识,因此网络舆情的情感倾向及演化变的尤为重要,对政府的行政方式和决策机制都产生了极大的影响。所以,网络舆情分析技术便应运而生。本文在传统文本分类算法支持向量机的基础上,针对网络社交媒介引入特定的情感词典,并将其应用在特征选择方面,构造文本倾向性分类器,使用该分类器判别微博的情感极性(正向或负向)。同时,进一步研究网络舆情的演化规律情况,即舆情热度的变化规律,综合考虑影响舆情热度的驱动因素,最后通过实验验证论文中采用的方法的可行性与有效性。本文的主要研究内容可以概括为以下四个方面:1.对How Net中文词典重新整理与补充,尝试构建网络舆情分析的特定情感词典,为下文网络舆情情感分类器的构建奠定了一定的实验基础;2.对原始实验数据进行人工标注,并进行数据预处理;3.将情感词典应用到文本特征选择上,提出将词频法和互信息法相结合的特征提取方法,选取满足条件的特征并计算其权值,训练模型,并通过实验验证本文所提方法的有效性;4.利用训练得到的情感分类器对整体微博舆情进行极性判断,得到负向舆情信息集合,使用回归模型分析负面网络舆情的演化规律,并对网络舆情热度进行研究,找出影响舆情热度的因素,分析每种因素对舆情热度影响的显著性,建立多元线性回归预测模型,最后分析预测负向舆情与整体舆情热度的演化规律。实验表明,在网络舆情情感分类方面,引入情感词典之后,所选取的特征更加具有领域性和代表性,再将词频和互信息方法相结合更能很好的表征数据,实验结果较单纯使用词频和互信息的特征选择方法更加有效。在网络舆情演化分析方面,把影响舆情热度的驱动因素作为多元线性回归模型的自变量,分析自变量的显著性以及它们之间是否存在多重共线性,并对模型的预测值和实际值做差值分析,证明了模型应用于预测的可行性。最后,使用回归模型对负向舆情信息和整体舆情信息的热度做对比,分析了时序网络舆情的演化规律。
【关键词】:倾向性分类 舆情分析 特征选择 多元线性回归
【学位授予单位】:吉林大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP391.1
【目录】:
- 摘要4-6
- Abstract6-10
- 第1章 绪论10-17
- 1.1 研究背景和意义10-12
- 1.2 国内外研究现状12-15
- 1.3 本文研究工作15-16
- 1.4 本文组织结构16-17
- 第2章 相关理论及关键技术17-27
- 2.1 网络舆情分析介绍及相关理论17-21
- 2.1.1 网络舆情技术17-18
- 2.1.2 网络舆情的传播18-21
- 2.1.3 有关网络舆情的其他研究21
- 2.2 倾向性分析21-25
- 2.2.1 研究分类21-22
- 2.2.2 技术分类22-25
- 2.3 多元线性回归分析25-27
- 第3章 基于情感词典的网络舆情倾向性分类研究27-48
- 3.1 基于How Net的情感词典构造27-32
- 3.1.1 How Net简介27-28
- 3.1.2 基于How Net的词语相似度计算28-29
- 3.1.3 知网How Net词典的扩展29-32
- 3.2 基于情感词典框架下的网络舆情倾向性分类32-42
- 3.2.1 数据预处理33-35
- 3.2.2 文本特征提取35-36
- 3.2.3 线性组合特征选取算法36-40
- 3.2.4 特征权重计算40-42
- 3.3 实验测试及结果分析42-48
- 3.3.1 实验环境及参数选取42
- 3.3.2 分类器学习方法的选择42-43
- 3.3.3 评估标准43-44
- 3.3.4 算法测试及对比分析44-48
- 第4章 时序信息的网络舆情演化规律模型48-59
- 4.1 网络舆情演化48-49
- 4.2 网络舆情演化的驱动因素49-52
- 4.2.1 网络舆情驱动因素介绍49-50
- 4.2.2 网络舆情驱动因素分析50-52
- 4.3 多元线性回归预测52-53
- 4.4 实验结果及分析53-59
- 4.4.1 问题描述53
- 4.4.2 实验过程53-59
- 第5章 总结与展望59-60
- 参考文献60-64
- 作者简介及在学期间科研成果64-65
- 致谢65
【参考文献】
中国期刊全文数据库 前10条
1 刘培玉;张艳辉;朱振方;荀静;;融合表情符号的微博文本倾向性分析[J];山东大学学报(理学版);2014年11期
2 李剑萍;;基于链接网络图探讨对互联网舆情话题的跟踪方法[J];信息与电脑(理论版);2012年10期
3 邱云飞;王威;刘大有;邵良杉;;基于方差的CHI特征选择方法[J];计算机应用研究;2012年04期
4 刘勘;李晶;刘萍;;基于马尔可夫链的舆情热度趋势分析[J];计算机工程与应用;2011年36期
5 崔薇;曾润喜;王国华;;中国网络舆情研究文献计量分析[J];情报科学;2011年01期
6 刘怡君;牛文元;;舆论形成及其演化的机理建模分析[J];科学对社会的影响;2009年03期
7 周立柱;贺宇凯;王建勇;;情感分析研究综述[J];计算机应用;2008年11期
8 姚天f ;程希文;徐飞玉;汉思·乌思克尔特;王睿;;文本意见挖掘综述[J];中文信息学报;2008年03期
9 梅雪;程学旗;郭岩;张刚;丁国栋;;一种全自动生成网页信息抽取Wrapper的方法[J];中文信息学报;2008年01期
10 王永恒;贾焰;杨树强;;大规模文本数据库中的短文分类方法[J];计算机工程与应用;2006年22期
中国硕士学位论文全文数据库 前2条
1 谢乾龙;微博舆情分析系统关键技术研究[D];北京邮电大学;2013年
2 韩威;网络舆情热点发现与话题跟踪技术研究[D];哈尔滨工业大学;2012年
本文关键词:基于情感倾向性的网络舆情分析及演化预测研究,由笔耕文化传播整理发布。
本文编号:364200
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/364200.html