网络舆情监测管理系统设计的研究与应用
发布时间:2017-07-20 07:26
本文关键词:网络舆情监测管理系统设计的研究与应用
更多相关文章: 网络舆情 舆情采集 文本聚类 文本分类 舆情分析
【摘要】:互联网除了具备社会舆情即时性、隐蔽性、随意性、发散性和渗透性等特征,还具有自己独有的特点:突发性、互动性、丰富性和偏差性。在日前呈几何数增长的海量数据信息中发现具有一定影响力的事件和热点话题,并在追踪这些热点话题的过程中对网络舆情进行有效控制变得十分重要。 本文对网络舆情监测管理系统的关键技术进行了详细的研究,包括网络舆情信息采集技术、网页文本预处理技术、话题发现和话题追踪技术,以及网络舆情倾向性分析技术。其中,,网络舆情信息采集技术是将松散的结构化信息抽取出来,包括网络爬虫和元搜索引擎等技术;网页文本预处理技术是为了过滤网页中的噪声信息,包括网页去噪、中文分词、特征提取等技术;话题发现和话题追踪技术在本质上是一个文本聚类和文本分类的过程;网络舆情倾向性分析技术包括基于语义的文本倾向性研究和基于机器的文本倾向性研究。 在对以上几种关键技术研究的基础上,本文提出了舆情监测系统的框架,介绍了本原型系统所使用到的关键技术和开发工具,并设计组成原型系统的功能模块图。完成了基于B/S的网络舆情监测管理系统的整体设计和安全保障体系设计。实现了对网络舆情的发现,同时能够较好地对互联网上的热点事件,突发事件,以及敏感信息等实现实时地监控。并在最后总结了本文所研究的主要内容和需要改进的方面。
【关键词】:网络舆情 舆情采集 文本聚类 文本分类 舆情分析
【学位授予单位】:湖南大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP391.1;TP311.52
【目录】:
- 摘要5-6
- Abstract6-9
- 第1章 绪论9-13
- 1.1 研究背景及意义9-10
- 1.2 国内外研究现状10-12
- 1.2.1 国外研究现状10-11
- 1.2.2 国内研究现状11-12
- 1.3 论文研究内容及章节12-13
- 第2章 系统开发相关技术介绍13-29
- 2.1 网络信息采集技术13-15
- 2.1.1 网络爬虫技术13-14
- 2.1.2 元搜索引擎技术14-15
- 2.2 网页文本预处理技术15-18
- 2.2.1 网页去噪技术15-17
- 2.2.2 中文分词技术17-18
- 2.2.3 特征提取技术18
- 2.3 数据库技术18-21
- 2.3.1 数据库简介19
- 2.3.2 数据库分类19-20
- 2.3.3 数据库管理系统20-21
- 2.4 J2EE 技术21-28
- 2.4.1 Java 技术21-23
- 2.4.2 SSH 框架23-28
- 2.5 本章小结28-29
- 第3章 网络舆情话题发现与追踪技术29-39
- 3.1 网络舆情话题的发现与追踪过程29-30
- 3.2 网络舆情话题发现技术30-35
- 3.2.1 话题发现的文本聚类算法30-34
- 3.2.2 各聚类算法的比较与选取34-35
- 3.3 网络舆情话题追踪技术35-38
- 3.3.1 话题追踪的文本分类算法35-37
- 3.3.2 各分类算法的比较与选取37-38
- 3.4 本章小结38-39
- 第4章 网络舆情倾向性分析技术39-44
- 4.1 网络舆情倾向性分类基本流程39-40
- 4.2 网络舆情倾向性分析技术40-42
- 4.2.1 基于语义的网络舆情倾向性分析方法40-41
- 4.2.2 基于机器学习的网络舆情倾向性分析方法41-42
- 4.3 本章小结42-44
- 第5章 网络舆情监测管理原型系统44-59
- 5.1 系统总体结构44-45
- 5.2 开发技术与环境介绍45-47
- 5.2.1 系统开发工具45-46
- 5.2.2 系统运行环境46-47
- 5.3 系统功能模块设计47-49
- 5.3.1 舆情信息采集模块47-48
- 5.3.2 舆情信息处理模块48
- 5.3.3 舆情分析模块48-49
- 5.3.4 舆情管理模块49
- 5.4 系统功能模块的实现49-53
- 5.4.1 用户登录界面49-50
- 5.4.2 舆情信息采集模块界面50-51
- 5.4.3 舆情信息处理模块界面51
- 5.4.4 舆情信息分析模块界面51-52
- 5.4.5 舆情信息管理模块界面52-53
- 5.5 系统功安全保障体系53-55
- 5.5.1 网络安全53-54
- 5.5.2 数据资源安全54-55
- 5.6 系统测试55-57
- 5.6.1 单元测试55-57
- 5.6.2 集成测试57
- 5.7 本章小结57-59
- 结论59-61
- 参考文献61-65
- 致谢65
【参考文献】
中国期刊全文数据库 前10条
1 孙立伟;何国辉;吴礼发;;网络爬虫技术的研究[J];电脑知识与技术;2010年15期
2 邱立坤;龙志yN;钟华;程葳;;层次化话题发现与跟踪方法及系统实现[J];广西师范大学学报(自然科学版);2007年02期
3 王继成,潘金贵,张福炎;Web文本挖掘技术研究[J];计算机研究与发展;2000年05期
4 韩家炜,孟小峰,王静,李盛恩;Web挖掘研究[J];计算机研究与发展;2001年04期
5 于满泉;骆卫华;许洪波;白硕;;话题识别与跟踪中的层次化话题识别技术研究[J];计算机研究与发展;2006年03期
6 涂承胜,鲁明羽,陆玉昌;Web挖掘研究综述[J];计算机工程与应用;2003年10期
7 刘迁;贾惠波;;中文信息处理中自动分词技术的研究与展望[J];计算机工程与应用;2006年03期
8 李勇;韩亮;;主题搜索引擎中网络爬虫的搜索策略研究[J];计算机工程与科学;2008年03期
9 赵伟,戴新宇,尹存燕,陈家骏;一种规则与统计相结合的汉语分词方法[J];计算机应用研究;2004年03期
10 刘金红;陆余良;;主题网络爬虫研究综述[J];计算机应用研究;2007年10期
本文编号:566914
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/566914.html