基于语义统计分析的网络舆情挖掘技术研究
发布时间:2021-03-26 05:38
随着互联网技术的发展和网络应用的普及,互联网成为民众获取信息的重要来源,同时也成为人们传播信息和表达观点的重要渠道。通过网络了解社情民意,关注舆情动向,对于促进社会和谐稳定、推动社会民主与法制建设具有重要的现实意义。网络信息浩如烟海,鱼龙混杂,人工识别和研判显得力不从心。如何利用计算机网络技术、人工智能技术和数据挖掘技术,对网络舆情信息有效地挖掘和分析成为了一个新的研究热点。如何识别民众所关注的热点话题并有效地分类,如何判断民众对社会事件的态度是正向的还是反向的,如何分析和把握社会热点事件的波动性等,是网络舆情研究中的亟需解决的重点问题,对认识和引导网络舆情具有重要的科学意义。本文针对网络舆情信息的挖掘和分析中存在的问题展开研究,将基于Web的文本分类技术、机器学习算法研究、波动性的统计分析等技术应用到网络突发事件的分类、网络舆情信息的情感倾向性分析、舆情演变的波动性分析等研究中。主要的研究内容和创新点包括:1.本文提出将Fisher判别准则应用到网络舆情文本的分类问题中,并实现对突发事件的分类。由突发事件引发的网络舆情信息,从内容形式来看主要为文本,因此舆情信息的分类本质上是文本分类...
【文章来源】:武汉理工大学湖北省 211工程院校 教育部直属院校
【文章页数】:122 页
【学位级别】:博士
【文章目录】:
中文摘要
Abstract
第1章 绪论
1.1 论文研究背景
1.1.1 舆情和网络舆情
1.1.2 网络舆情挖掘的研究意义
1.2 国内外网络舆情研究现状
1.2.1 基于潜在语义分析的文本分类
1.2.2 情感倾向性分类
1.2.3 网络舆情信息的演变分析
1.3 本文的主要研究内容
1.4 本文的章节结构
第2章 网络舆情信息挖掘和分析方法概述
2.1 引言
2.2 网络舆情信息的采集
2.2.1 舆情信息采集的来源
2.2.2 网络舆情信息采集策略
2.3 基于WEB挖掘的网络舆情信息分析
2.3.1 网络舆情话题检测与跟踪
2.3.2 基于Web的文本挖掘和分类
2.3.3 文本的情感倾向性分析
2.3.4 舆情信息的演变和数据流挖掘
2.4 网络舆情挖掘和分析的架构体系
2.5 本章小结
第3章 网络突发事件舆情信息的分类研究
3.1 研究背景
3.2 文本分类的相关方法介绍
3.2.1 文本表示模型
3.2.2 文本的特征选择方法
3.2.3 文本的分类方法
3.2.4 文本分类效果的评价指标
3.3 基于FISHER判别的特征提取方法
3.3.1 Fisher线性判别准则
3.3.2 Fisher线性判别用于文本特征提取
3.3.3 实验结果和分析
3.4 突发事件舆情信息的分类研究
3.4.1 网络舆情关键词的选择
3.4.2 突发事件分类语料的获取
3.4.3 分类性能的比较
3.5 本章小结
第4章 基于局部潜在语义分析的舆情文本分类
4.1 研究背景及相关研究
4.2 潜在语义分析
4.2.1 潜在语义分析的原理
4.2.2 奇异值分解
4.2.3 利用奇异值分解计算各种相似关系
4.3 基于局部潜在语义分析的WEB文本分类
4.3.1 特征词的局部特性
4.3.2 局部潜在语义分析
4.3.3 局部区域的生成
4.4 实验及结果分析
4.4.1 实验数据及预处理
4.4.2 实验结果及分析
4.5 本章小结
第5章 网络舆情信息的情感倾向性分析
5.1 引言
5.2 情感倾向性分析的相关研究
5.2.1 不同粒度的情感倾向性分析研究
5.2.2 中文情感分析评测及语料库
5.3 基于机器学习的情感倾向性分类方法
5.4 模式匹配和机器学习相结合的情感倾向性分类
5.4.1 PMML方法结构流程
5.4.2 关键词的提取
5.4.3 模式的提取和匹配
5.4.4 文本的情感倾向性计算
5.5 实验结果及分析
5.5.1 实验数据来源
5.5.2 数据的处理
5.5.3 实验设置和结果
5.6 本章小结
第6章 网络舆情信息演变的波动性分析
6.1 背景介绍
6.2 网络舆情信息演化的统计计量研究
6.3 网络舆情信息演化的波动性特征
6.4 GARCH类模型相关介绍
6.4.1 GARCH类模型概述
6.4.2 从ARCH到GARCH
6.4.3 GARCH模型的检验和参数估计
6.4.4 不对称的GARCH类模型
6.5 基于GARCH类模型的舆情信息波动性分析
6.5.1 研究对象
6.5.2 数据收集和处理
6.5.3 GARCH模型的建立
6.5.4 不对称性的模型的建立
6.6 本章小结
第7章 总结与展望
7.1 全文工作总结
7.2 进一步的展望
参考文献
攻读博士学位期间发表的论文
攻读博士学位期间参加研究的项目
致谢
附录
【参考文献】:
期刊论文
[1]网络舆情演化的阶段分析[J]. 潘崇霞. 计算机与现代化. 2011(10)
[2]文本分类中特征选择方法的比较与改进[J]. 单丽莉,刘秉权,孙承杰. 哈尔滨工业大学学报. 2011(S1)
[3]重大公共危机网络舆情扩散监测和规律分析[J]. 孙佰清,董靖巍. 哈尔滨工业大学学报(社会科学版). 2011(01)
[4]基于Stacking组合分类方法的中文情感分类研究[J]. 李寿山,黄居仁. 中文信息学报. 2010(05)
[5]基于潜在语义分析和HS-SVM的文本分类模型研究[J]. 张玉峰,何超. 情报理论与实践. 2010(07)
[6]一种基于知网的中文句子情感倾向判别方法[J]. 党蕾,张蕾. 计算机应用研究. 2010(04)
[7]基于机器学习的网络新闻评论情感分类研究[J]. 周杰,林琛,李弼程. 计算机应用. 2010(04)
[8]跨领域倾向性分析相关技术研究[J]. 吴琼,谭松波,张刚,段洣毅,程学旗. 中文信息学报. 2010(01)
[9]使用机器学习对汉语评论进行情感分类[J]. 白鸽,左万利,赵乾坤,曲仁镜. 吉林大学学报(理学版). 2009(06)
[10]网络舆情突发事件预警系统、指标与机制[J]. 曾润喜,徐晓林. 情报杂志. 2009(11)
博士论文
[1]基于内容的互联网舆情信息挖掘关键技术研究[D]. 刘玉国.山东大学 2011
[2]文本倾向性分析中的情感词典构建技术研究[D]. 杜伟夫.哈尔滨工业大学 2010
[3]基于Web的评论文本情感分类问题研究[D]. 王素格.上海大学 2008
[4]互联网舆情信息挖掘方法研究[D]. 杜阿宁.哈尔滨工业大学 2007
[5]高性能文本分类算法研究[D]. 谭松波.中国科学院研究生院(计算技术研究所) 2006
硕士论文
[1]互联网中危机信息传播规律及应对模式研究[D]. 陆题佳.中国科学技术大学 2010
[2]基于网络语义挖掘的舆情监测预警研究[D]. 刘恒文.武汉理工大学 2010
[3]网络舆情数据获取与话题分析技术研究[D]. 王允.解放军信息工程大学 2010
本文编号:3101054
【文章来源】:武汉理工大学湖北省 211工程院校 教育部直属院校
【文章页数】:122 页
【学位级别】:博士
【文章目录】:
中文摘要
Abstract
第1章 绪论
1.1 论文研究背景
1.1.1 舆情和网络舆情
1.1.2 网络舆情挖掘的研究意义
1.2 国内外网络舆情研究现状
1.2.1 基于潜在语义分析的文本分类
1.2.2 情感倾向性分类
1.2.3 网络舆情信息的演变分析
1.3 本文的主要研究内容
1.4 本文的章节结构
第2章 网络舆情信息挖掘和分析方法概述
2.1 引言
2.2 网络舆情信息的采集
2.2.1 舆情信息采集的来源
2.2.2 网络舆情信息采集策略
2.3 基于WEB挖掘的网络舆情信息分析
2.3.1 网络舆情话题检测与跟踪
2.3.2 基于Web的文本挖掘和分类
2.3.3 文本的情感倾向性分析
2.3.4 舆情信息的演变和数据流挖掘
2.4 网络舆情挖掘和分析的架构体系
2.5 本章小结
第3章 网络突发事件舆情信息的分类研究
3.1 研究背景
3.2 文本分类的相关方法介绍
3.2.1 文本表示模型
3.2.2 文本的特征选择方法
3.2.3 文本的分类方法
3.2.4 文本分类效果的评价指标
3.3 基于FISHER判别的特征提取方法
3.3.1 Fisher线性判别准则
3.3.2 Fisher线性判别用于文本特征提取
3.3.3 实验结果和分析
3.4 突发事件舆情信息的分类研究
3.4.1 网络舆情关键词的选择
3.4.2 突发事件分类语料的获取
3.4.3 分类性能的比较
3.5 本章小结
第4章 基于局部潜在语义分析的舆情文本分类
4.1 研究背景及相关研究
4.2 潜在语义分析
4.2.1 潜在语义分析的原理
4.2.2 奇异值分解
4.2.3 利用奇异值分解计算各种相似关系
4.3 基于局部潜在语义分析的WEB文本分类
4.3.1 特征词的局部特性
4.3.2 局部潜在语义分析
4.3.3 局部区域的生成
4.4 实验及结果分析
4.4.1 实验数据及预处理
4.4.2 实验结果及分析
4.5 本章小结
第5章 网络舆情信息的情感倾向性分析
5.1 引言
5.2 情感倾向性分析的相关研究
5.2.1 不同粒度的情感倾向性分析研究
5.2.2 中文情感分析评测及语料库
5.3 基于机器学习的情感倾向性分类方法
5.4 模式匹配和机器学习相结合的情感倾向性分类
5.4.1 PMML方法结构流程
5.4.2 关键词的提取
5.4.3 模式的提取和匹配
5.4.4 文本的情感倾向性计算
5.5 实验结果及分析
5.5.1 实验数据来源
5.5.2 数据的处理
5.5.3 实验设置和结果
5.6 本章小结
第6章 网络舆情信息演变的波动性分析
6.1 背景介绍
6.2 网络舆情信息演化的统计计量研究
6.3 网络舆情信息演化的波动性特征
6.4 GARCH类模型相关介绍
6.4.1 GARCH类模型概述
6.4.2 从ARCH到GARCH
6.4.3 GARCH模型的检验和参数估计
6.4.4 不对称的GARCH类模型
6.5 基于GARCH类模型的舆情信息波动性分析
6.5.1 研究对象
6.5.2 数据收集和处理
6.5.3 GARCH模型的建立
6.5.4 不对称性的模型的建立
6.6 本章小结
第7章 总结与展望
7.1 全文工作总结
7.2 进一步的展望
参考文献
攻读博士学位期间发表的论文
攻读博士学位期间参加研究的项目
致谢
附录
【参考文献】:
期刊论文
[1]网络舆情演化的阶段分析[J]. 潘崇霞. 计算机与现代化. 2011(10)
[2]文本分类中特征选择方法的比较与改进[J]. 单丽莉,刘秉权,孙承杰. 哈尔滨工业大学学报. 2011(S1)
[3]重大公共危机网络舆情扩散监测和规律分析[J]. 孙佰清,董靖巍. 哈尔滨工业大学学报(社会科学版). 2011(01)
[4]基于Stacking组合分类方法的中文情感分类研究[J]. 李寿山,黄居仁. 中文信息学报. 2010(05)
[5]基于潜在语义分析和HS-SVM的文本分类模型研究[J]. 张玉峰,何超. 情报理论与实践. 2010(07)
[6]一种基于知网的中文句子情感倾向判别方法[J]. 党蕾,张蕾. 计算机应用研究. 2010(04)
[7]基于机器学习的网络新闻评论情感分类研究[J]. 周杰,林琛,李弼程. 计算机应用. 2010(04)
[8]跨领域倾向性分析相关技术研究[J]. 吴琼,谭松波,张刚,段洣毅,程学旗. 中文信息学报. 2010(01)
[9]使用机器学习对汉语评论进行情感分类[J]. 白鸽,左万利,赵乾坤,曲仁镜. 吉林大学学报(理学版). 2009(06)
[10]网络舆情突发事件预警系统、指标与机制[J]. 曾润喜,徐晓林. 情报杂志. 2009(11)
博士论文
[1]基于内容的互联网舆情信息挖掘关键技术研究[D]. 刘玉国.山东大学 2011
[2]文本倾向性分析中的情感词典构建技术研究[D]. 杜伟夫.哈尔滨工业大学 2010
[3]基于Web的评论文本情感分类问题研究[D]. 王素格.上海大学 2008
[4]互联网舆情信息挖掘方法研究[D]. 杜阿宁.哈尔滨工业大学 2007
[5]高性能文本分类算法研究[D]. 谭松波.中国科学院研究生院(计算技术研究所) 2006
硕士论文
[1]互联网中危机信息传播规律及应对模式研究[D]. 陆题佳.中国科学技术大学 2010
[2]基于网络语义挖掘的舆情监测预警研究[D]. 刘恒文.武汉理工大学 2010
[3]网络舆情数据获取与话题分析技术研究[D]. 王允.解放军信息工程大学 2010
本文编号:3101054
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/3101054.html