当前位置:主页 > 社科论文 > 新闻传播论文 >

面向多来源新闻的领域事件分析

发布时间:2020-08-10 16:01
【摘要】:突发公共事件对人民生命健康和财产安全、正常生活生产带来严重威胁,突发公共事件的防范与快速处置已成为国家科技发展的重点领域。在网络环境下,网络空间与现实世界虚实映照,现实世界中所发生的事件会通过网络空间中不同来源不同媒体数据从不同侧面来反映与表达。通过分析网络空间中的媒体数据及时感知现实世界中的事件,已成为当前人们有效应对突发事件的一大技术手段。本文聚焦在多源新闻媒体数据的实时分析上,在深入研究事件的表示模型的基础上,通过汇聚网络空间中不同来源的新闻媒体数据进行实时分析,进而实现事件的识别,主要工作包括:(1)本文结合公共安全的领域特点设计了领域事件模型,有效刻画突发公共事件的分类主题、时空特性以及主题致灾因子与应急主体之间的互动关系,有效支持后续的事件识别与多维搜索。(2)本文重点研究多源新闻结构化分析与事件检测技术。针对多源新闻的转载问题,采用哈希的方式实现新闻转载判别,减少冗余计算;针对开放域新闻的主题多样性问题,采用领域模型规则触发并校验的方式实现分类主题标引,缩减了计算规模的同时提升准确率;针对事件的要素约束性,结合领域事件模型对各个要素进行抽取,采用启发式规则进行时空要素提取,并在时空约束下结合多特征相似性策略以事件为粒度对新闻进行聚合。通过相关实验表明了本文所提方法的有效性。(3)本文结合分布式实时计算的需求设计并搭建了原型系统,通过食品安全领域的测试验证,表明系统结果运行良好,可基本满足实际应用需求。
【学位授予单位】:浙江大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:G212;TP391.1
【图文】:

本体模型,简单事件,新闻事件,新闻


浙江大学硕±学位论文逦第2章国内外研巧现状逡逑系(Instance-of)邋,邋F邋(Function)表示函数,定义了属性和属性值的映射关系,逡逑A(Axiom)代表公理,是被公认的推理规贝!I,I邋(Instance)代表实例,是抽象的类逡逑概念的具体个体。逡逑文献"欵出了简单事件本体模型(SimpleEventModel,SEM)。作者的用意逡逑是用最少的语义模块来表达事件,达到最大的通用性。作者将语义模块分成H个逡逑层次,核屯、概念层,类型系统层和属性约束层,如图11所示。事件是核屯概念逡逑之一,它包含所有其他核也概念如参与者、地点和时间。每个核屯、概念都关联着逡逑类型信息。针对某些核屯、概念和类型,属性约束层做了一定的限制。简单事件模逡逑型突出了简洁通用的特点,但对内容维度只细化到时空和参与者,表现力略显不逡逑足。逡逑

海量数据,平台


逦第5章面向分布式实时计算的原型系统设计与实现逡逑整个系统是一个从互联网采集到最终用户呈现的流程。系统部署情况如图5.2逡逑所示。系统分别采用一台机器进行数据采集,原始数据存储和前端网页服务。采逡逑用5台机器运行支持MapReduce分布式批量处理的D-Ocean数据管理平台。采用逡逑4台机器作为Storm部署环境,其中1台作为控制节点部署Nimbus服务,其余3逡逑台作为工作节点部署Zookeeper服务和Supervisor服务。逡逑Storm逡逑、1逡逑P邋1逦^作..I逡逑i4fr邋^£r逡逑U^132逦U^55逦,邋UDgMeS出m逦UDMS-133 ̄U5逦!逡逑^逦Mon^oDB逦——*邋??-邋——邋——-邋-邋邋邋邋逡逑气Red邋is逦、逡逑洗K逦I'逦争入1邋I逦?邋Q逡逑敬邋web邋I邋巧^逦[〉哉^逡逑MsfeJJ逦I逦W逡逑.UDMS-156-160逦'逦UDMS-151逡逑_邋 ̄50Tea7邋—逦MySQL逡逑图5.2系统货施平台部署逡逑5.2.2海量数据氋效存储与管理逡逑从图5.1可看出,在构建的系统中涉及多种数据库,这些数据库具有不同的逡逑作用。UDMS-155上搭建了邋MongoDB数据库,用于存储爬虫爬下来的网页信息。逡逑不同于字段为粒度关系型数据库,MongoDB是一种文档数据库,每条数据是逡逑用类化ON格式的完整文档,如图5.3所示。同时在同一台机器上还部署了邋Redis逡逑数据库

本体模型,简单事件,新闻事件,新闻


浙江大学硕±学位论文逦第2章国内外研巧现状逡逑系(Instance-of)邋,邋F邋(Function)表示函数,定义了属性和属性值的映射关系,逡逑A(Axiom)代表公理,是被公认的推理规贝!I,I邋(Instance)代表实例,是抽象的类逡逑概念的具体个体。逡逑文献"欵出了简单事件本体模型(SimpleEventModel,SEM)。作者的用意逡逑是用最少的语义模块来表达事件,达到最大的通用性。作者将语义模块分成H个逡逑层次,核屯、概念层,类型系统层和属性约束层,如图11所示。事件是核屯概念逡逑之一,它包含所有其他核也概念如参与者、地点和时间。每个核屯、概念都关联着逡逑类型信息。针对某些核屯、概念和类型,属性约束层做了一定的限制。简单事件模逡逑型突出了简洁通用的特点,但对内容维度只细化到时空和参与者,表现力略显不逡逑足。逡逑

【参考文献】

相关期刊论文 前3条

1 蔡偃武;高大启;阮彤;蒋锐权;;面向大规模数据的在线新事件检测[J];计算机工程;2014年10期

2 夏彦;何琳;潘运来;欧阳辰晨;;基于规则与统计相结合的互联网突发事件识别研究[J];现代图书情报技术;2010年10期

3 陈伟;张成;王灿;卜佳俊;陈纯;陈宏;;新闻数据流的在线事件检测[J];浙江大学学报(工学版);2011年06期

相关博士学位论文 前1条

1 高田;基于领域知识的旅游突发事件状态评估与演化研究[D];北京邮电大学;2011年



本文编号:2788311

资料下载
论文发表

本文链接:https://www.wllwen.com/xinwenchuanbolunwen/2788311.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户e9222***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com