基于语义网的舆情监控系统的设计与实现
本文关键词:基于语义网的舆情监控系统的设计与实现,由笔耕文化传播整理发布。
【摘要】:随着网络信息技术的快速发展,特别是社交网络的活跃,给言论自由开辟了一条便捷的途径,但有人却利用网络故意造谣和歪曲事实误导民众,给社会和企业造成了严重的不良影响,为积极应对突发的网络舆情,迫切需要运用信息化手段实现网络舆情的自动监控。大部分舆情监控所采取的机制是对网络信息进行关键词全文检索,将匹配到一个或多个舆情关键词的信息确定为相关舆情信息,导致出现很多与舆情无关的内容,准确率较低。本文根据兰州石化公司舆情监控的实际需要,设计并实现了一个基于语义网的舆情监控系统。该系统将语义网技术引入舆情监控当中,收集与舆情相关的领域知识,建立了舆情本体和情感本体,利用本体可推理的特性对信息进行舆情推理分析。通过在情感本体中设置情感强度和级性,判断信息中的主观倾向,从而实现舆情工作的高效准确。舆情监控的主要工作有信息采集和舆情研判,该系统设计为两层结构:信息采集层和舆情处理层。信息采集层具有“网络爬虫”模块、“网页净化处理”模块和“中文分词”模块,功能分别是广泛采集网络信息,对采集的网页做主题内容提取,再将提取出的纯文本信息进行分词处理。舆情处理层的功能是将采集的信息与舆情本体匹配,对匹配到的本体进行舆情抽取及舆情推理,最后生成舆情信息报告。论文主要完成了基于语义网的舆情监控系统的需求分析、详细设计和系统实现。目前该系统已投入运行,能有效辐射主流舆论站点,准确率达到舆情监控的需求,为兰州石化公司的维稳工作做出了积极的贡献。
【关键词】:网络舆情 网络信息采集 网页净化 中文分词 语义网 本体 舆情抽取 舆情推理
【学位授予单位】:兰州大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP391.1;TP277
【目录】:
- 中文摘要3-4
- Abstract4-9
- 第一章 绪论9-14
- 1.1 论文研究背景9-10
- 1.2 研究现状10-11
- 1.3 论文主要工作11-12
- 1.4 论文的组织结构12-14
- 第二章 系统需求分析及总体设计方案14-19
- 2.1 系统总体需求描述14-15
- 2.2 系统框架设计15
- 2.3 系统体系结构设计15-17
- 2.3.1 舆情信息采集功能模块16
- 2.3.2 舆情信息分析功能模块16-17
- 2.3.3 系统架构设计17
- 2.4 系统开发环境和采用的软件17-18
- 2.5 本章小结18-19
- 第三章 信息采集功能的设计与实现19-34
- 3.1 信息采集19-25
- 3.1.1 信息采集的范围19
- 3.1.2 网络爬虫19-20
- 3.1.3 PageRank网页排序技术算法20-21
- 3.1.4 深度优先策略21-22
- 3.1.5 广度优先策略22
- 3.1.6 最佳优先策略22-23
- 3.1.7 搜索引擎辅助采集23
- 3.1.8 应用效果及主要技术指标23-24
- 3.1.9 采集信息数据库表结构24-25
- 3.2 网页净化处理25-29
- 3.2.1 网页内容结构分析26-27
- 3.2.2 网页内容块类型的判断27
- 3.2.3 主题内容块的判断算法及页面净化过程27-29
- 3.3 中文分词技术29-33
- 3.3.1 中文分词的算法29
- 3.3.2 基于词库匹配的算法29-30
- 3.3.3 基于统计的分词算法30-31
- 3.3.4 基于规则的分词算法31
- 3.3.5 中文分词的设计及实现31-33
- 3.4 本章小结33-34
- 第四章 舆情处理功能的设计与实现34-57
- 4.1 语义网35-38
- 4.1.1 语义网的概念35
- 4.1.2 语义网体系结构35-38
- 4.2 本体的概念、特点和构建依据38-39
- 4.2.1 本体的概念38
- 4.2.2 本体的功能特点38-39
- 4.2.3 本体的构建规则39
- 4.3 本体语言39-42
- 4.3.1 本体建模语言选择39-40
- 4.3.2 OWL的三个子语言的描述40-41
- 4.3.3 OWL-Lite语言描述41
- 4.3.4 本体开发工具41-42
- 4.4 舆情本体构建的流程及方法42-43
- 4.4.1 舆情本体的构建流程42-43
- 4.4.2 舆情本体循环获取构建方法43
- 4.5 舆情本体的构建43-48
- 4.5.1 收集整理舆情主题词并建立主题词表43-45
- 4.5.2 舆情本体的构建45-48
- 4.5.3 本体数据库ER图48
- 4.6 基于语义的舆情分析48-55
- 4.6.1 基于本体的舆情匹配49-50
- 4.6.2 计算权重值判断舆情50-51
- 4.6.3 本体规则描述及推理51-53
- 4.6.4 基于情感词的主观倾向判断53-55
- 4.7 系统应用测试55-56
- 4.8 小结56-57
- 第五章 总结57-59
- 5.1 论文的主要工作57-58
- 5.2 工作展望58-59
- 参考文献59-61
- 致谢61
【相似文献】
中国期刊全文数据库 前10条
1 胡文江;高永兵;李伟杰;;语义网中几种描述语言的比较研究[J];计算机技术与发展;2007年08期
2 徐涵;;顶级专家Frank van Harmelen揭秘语义网[J];程序员;2007年11期
3 冯永;李华;吴中福;钟将;叶春晓;;基于扩展语义网的知识资源组织技术研究[J];计算机科学;2008年03期
4 崔亚辉;;语义网的起源与发展[J];机械管理开发;2009年05期
5 刘一宁;;语义网主要技术发展分析[J];情报探索;2011年09期
6 孔邵颖;;语义网起源与发展研究[J];电脑编程技巧与维护;2011年22期
7 孔邵颖;;语义网中关键技术发展形势的探讨[J];科技传播;2012年01期
8 ;语义网:释放互联网的潜能[J];互联网周刊;2002年41期
9 王晓蓉;知识管理中的语义网方法[J];情报杂志;2004年05期
10 杜文华;语义网描述语言比较研究[J];情报杂志;2004年09期
中国重要会议论文全文数据库 前6条
1 朱江;张国宁;沈寿林;;语义网本体云影模型[A];第五届全国复杂网络学术会议论文(摘要)汇集[C];2009年
2 虞为;曹加恒;陈俊鹏;;一种对语义网上本体查询和检索的新方法(英文)[A];全国语域web与本体能研讨会论文集[C];2006年
3 朱江;白海涛;沈庆国;;基于语义的内容适配框架[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年
4 刘朔;乔彦友;温庆可;;基于语义网的GIS[A];第六届全国信息获取与处理学术会议论文集(1)[C];2008年
5 刘开瑛;;汉语框架语义网(CFN)构建现状[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
6 林培光;刘弘;樊孝忠;王涛;;一种新的语义网信息检索方法(英文)[A];全国语域web与本体能研讨会论文集[C];2006年
中国重要报纸全文数据库 前10条
1 陈颖健;语义网:能理解人类语言的智能网络[N];学习时报;2004年
2 王翔;大规模业务语义发掘为时尚早[N];网络世界;2008年
3 小林子;语义网:让网络学会思考[N];电脑报;2004年
4 萧国政 姬东鸿 国家社科基金重大项目“基于本体演化和事件结构的语义网模型研究”首席专家、武汉大学教授;智能性新一代语义网模型:语言科学与计算机科学的深度联姻[N];中国社会科学报;2012年
5 李sノ,
本文编号:299994
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/299994.html