传媒数据库建设的理念、流程和规范 ——以突发事件数据库为例
发布时间:2021-06-14 11:13
大数据技术为大数据时代传媒行业的转型与发展提供了新思路。建设传媒数据库是传媒机构发挥数据优势的有效途径,将有利于传媒业务的革新和传媒产业链的拓展。突发事件数据库作为传媒数据库的子数据库之一,在传媒实践领域具有重要的作用。绪论部分阐述了传媒亟需建设数据库的时代背景和现实需要,传媒数据库建设的理论意义与现实意义,传媒数据库建设的研究现状、突发事件数据库建设的研究现状及其它领域数据库建设的研究现状。第一章研究了大数据时代传媒建设数据库的必要性与可行性。建设传媒数据库将重塑大数据时代传媒行业的核心竞争力,优化传媒资源的整合方式,以及创新传媒行业的服务方式。大数据时代,海量信息以数据的方式呈现,大数据技术日渐成熟,传媒从业者向大数据人才复合发展,这些均为传媒数据库的建设与应用奠定了基础。第二章设计了基于人机协同理念的传媒数据库建设流程,以突发事件数据库为例,主要包括确立主题、数据采集、数据处理三个步骤。其中,数据采集的流程包括制定采集标准、设计采集工具、明确数据存储方式;数据处理的流程包括数据清洗、数据转换、数据检查。此外,还明确了每一个流程环节应该遵守的科学规范。第三章研究了数据挖掘的概念与主...
【文章来源】:华中师范大学湖北省 211工程院校 教育部直属院校
【文章页数】:65 页
【学位级别】:硕士
【部分图文】:
图2.2.1突发事件分级分类表??在建设突发事件数据库时,首先要明确突发事件的分级分类标准,弄清要建设??的数据库从属于哪一级分类,进一步细化所建数据库的主题,为下一步数据的采集??
则有“淹没”、“被困”、“救援”、“疏散”是网络爬虫工具从数据源中抓取与洪涝灾害相二十篇左右关于洪涝灾害本体、影响和救援的新初步确定为:(洪漠or山洪or内漠or降水or中断or道路淹没or伤亡or受伤or失踪oror救援or?紧急转移)。??采集的工具??据产生的速度超乎想象,传统的数据统计方式保数据的信度。因此,大数据时代提高数据采集据釆集软件。网络爬虫技术能实现“样本等于全海量的数据,通过客观数据展现事件。??为网络蜘蛛或Web信息采集器,是通过网页的链和个性化的Web网页搜索与采集。它通常从一运行,获得初始网页上的URL,在抓取网页的URL并存入待爬行URL系列,不断循环往复,直终止条件。其工作原理如图所示:??开始
具有一定的难度。??件的权威且真实的本体数据难以获取。突发事件发生后公安消防部等国家机构参与突发事件的应急救援管理,但因不具备突发事件数据内容和资源的整合能力,没有,重大突发事件发生后往往造成严重的社会后果,破坏件高度相关的一些细节往往具有机密性,不容易被外界自然语言处理的技术手段解决多种类、小样本的文本自件的种类繁多,不同类型的突发事件文本具有不同的特得仅靠机器算法自动采集突发事件数据难以达到令人采用聚焦爬虫技术抓取历史的和即时的新闻数据,它的容相关的网页。我们可以依据最小数据集及关键词过滤无关的链接,而保留相关规则的有用链接,并将该链接外,在编制程序时要将一定的搜索策略定义好,待程序URL队列。聚焦爬虫软件会重复上述流程,直至满足程所示:??
【参考文献】:
期刊论文
[1]重庆非物质文化遗产数据库建设与研究[J]. 罗敏. 重庆文理学院学报(社会科学版). 2018(04)
[2]建设“一带一路”沿线国家语言文化禁忌多媒体数据库[J]. 陈祥雨,陈美华. 外语研究. 2017(05)
[3]融媒体数据库安全技术研究[J]. 吴戈,陈俊,邱扬. 新闻前哨. 2017(08)
[4]中国术语数据库研究进展与趋势分析[J]. 闫宁,贺玢,王宝济,刘清水. 世界农业. 2016(12)
[5]蒙古语族多语种数据库标注规范研究[J]. 宝玉柱. 满语研究. 2015(02)
[6]数据库在全媒体新闻集团的应用与效益[J]. 宋宣谕. 青年记者. 2015(23)
[7]基于关系数据库的汉字构形分析及其应用[J]. 赵彤. 语言文字应用. 2015(03)
[8]大数据与生态史:中国灾害史料整理与数据库建设[J]. 夏明方. 清史研究. 2015(02)
[9]大数据与新闻报道[J]. 陈力丹,李熠祺,娜佳. 新闻记者. 2015(02)
[10]广电网络BOSS系统数据库优化技术研究[J]. 盛蕊,李想. 中国有线电视. 2014(11)
博士论文
[1]网络突发事件蔓延及干预研究[D]. 叶金珠.华中科技大学 2012
硕士论文
[1]道路交通事故数据库建设与传媒预警研究[D]. 于清.华中师范大学 2018
[2]大数据路径下台风灾害(2001-2010)的传媒预警研究[D]. 梁鹏.华中师范大学 2014
本文编号:3229713
【文章来源】:华中师范大学湖北省 211工程院校 教育部直属院校
【文章页数】:65 页
【学位级别】:硕士
【部分图文】:
图2.2.1突发事件分级分类表??在建设突发事件数据库时,首先要明确突发事件的分级分类标准,弄清要建设??的数据库从属于哪一级分类,进一步细化所建数据库的主题,为下一步数据的采集??
则有“淹没”、“被困”、“救援”、“疏散”是网络爬虫工具从数据源中抓取与洪涝灾害相二十篇左右关于洪涝灾害本体、影响和救援的新初步确定为:(洪漠or山洪or内漠or降水or中断or道路淹没or伤亡or受伤or失踪oror救援or?紧急转移)。??采集的工具??据产生的速度超乎想象,传统的数据统计方式保数据的信度。因此,大数据时代提高数据采集据釆集软件。网络爬虫技术能实现“样本等于全海量的数据,通过客观数据展现事件。??为网络蜘蛛或Web信息采集器,是通过网页的链和个性化的Web网页搜索与采集。它通常从一运行,获得初始网页上的URL,在抓取网页的URL并存入待爬行URL系列,不断循环往复,直终止条件。其工作原理如图所示:??开始
具有一定的难度。??件的权威且真实的本体数据难以获取。突发事件发生后公安消防部等国家机构参与突发事件的应急救援管理,但因不具备突发事件数据内容和资源的整合能力,没有,重大突发事件发生后往往造成严重的社会后果,破坏件高度相关的一些细节往往具有机密性,不容易被外界自然语言处理的技术手段解决多种类、小样本的文本自件的种类繁多,不同类型的突发事件文本具有不同的特得仅靠机器算法自动采集突发事件数据难以达到令人采用聚焦爬虫技术抓取历史的和即时的新闻数据,它的容相关的网页。我们可以依据最小数据集及关键词过滤无关的链接,而保留相关规则的有用链接,并将该链接外,在编制程序时要将一定的搜索策略定义好,待程序URL队列。聚焦爬虫软件会重复上述流程,直至满足程所示:??
【参考文献】:
期刊论文
[1]重庆非物质文化遗产数据库建设与研究[J]. 罗敏. 重庆文理学院学报(社会科学版). 2018(04)
[2]建设“一带一路”沿线国家语言文化禁忌多媒体数据库[J]. 陈祥雨,陈美华. 外语研究. 2017(05)
[3]融媒体数据库安全技术研究[J]. 吴戈,陈俊,邱扬. 新闻前哨. 2017(08)
[4]中国术语数据库研究进展与趋势分析[J]. 闫宁,贺玢,王宝济,刘清水. 世界农业. 2016(12)
[5]蒙古语族多语种数据库标注规范研究[J]. 宝玉柱. 满语研究. 2015(02)
[6]数据库在全媒体新闻集团的应用与效益[J]. 宋宣谕. 青年记者. 2015(23)
[7]基于关系数据库的汉字构形分析及其应用[J]. 赵彤. 语言文字应用. 2015(03)
[8]大数据与生态史:中国灾害史料整理与数据库建设[J]. 夏明方. 清史研究. 2015(02)
[9]大数据与新闻报道[J]. 陈力丹,李熠祺,娜佳. 新闻记者. 2015(02)
[10]广电网络BOSS系统数据库优化技术研究[J]. 盛蕊,李想. 中国有线电视. 2014(11)
博士论文
[1]网络突发事件蔓延及干预研究[D]. 叶金珠.华中科技大学 2012
硕士论文
[1]道路交通事故数据库建设与传媒预警研究[D]. 于清.华中师范大学 2018
[2]大数据路径下台风灾害(2001-2010)的传媒预警研究[D]. 梁鹏.华中师范大学 2014
本文编号:3229713
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3229713.html