当前位置:主页 > 科技论文 > 地质论文 >

基于社交媒体的地震灾情数据挖掘与烈度快速评估应用

发布时间:2020-08-26 00:21
【摘要】:地震灾害被称为群灾之首,而我国又是全球范围内地震灾害最为严重的国家之一。地震灾害分布区域广、发生频率高、造成损失严重是我国的基本国情,减轻地震灾害损失成为我国经济建设面临和必须重点关注的现实。破坏性地震发生后,如何高效、迅速地获取灾情信息并进行与地震损失相关的烈度评估,是地震应急救援和管理面临的关键问题,对这一问题的探索一直以来都是学术界瞄准的重要研究课题,也是灾区各级政府最为关注的问题之一。近年来,伴随着移动互联网技术的快速发展,蕴含海量数据的社交媒体平台为开展地震灾情获取和地震烈度快速评估提供了全新的视角和重要的途径。由于社交媒体数据具有海量性、时空性、交互性、强扩散性、融合性等特点,公众通过社交媒体可以自由表达自己的所见、观点与情感,无形中加速了灾情信息的共享与传播。挖掘震后用户自发贡献的社交媒体海量数据,使“众包”和“群智”思想在地震应急中发挥其应有作用,是有效提升地震灾情获取能力的重要途径与手段。鉴于此,本文在吸收信息科学、工程地震学、管理科学与工程以及统计学等学科的思想和方法的基础上,对社交媒体中震后灾情数据的抓取、甄别、存储以及其时空特征与主题分布特征等若干问题进行了深入研究,在此基础上结合机器学习中的人工神经网络算法,提出了一种基于社交媒体数据的地震烈度快速评估方法。研究的主要目标是统计并分析近年来我国大陆地区在社交媒体平台产生的地震灾情数据所呈现出的特点和规律,以此来推动社交媒体地震灾情数据挖掘这一新兴研究领域的发展,并探索一种新的基于社交媒体数据的烈度快速评估方法,以期提升地震应急救援工作的效率,为地震应急指挥决策提供参考依据。在充分吸收总结前人已有成果的基础上,本文以新浪微博移动端破坏性地震灾情数据为研究对象,致力于探索、解决地震应急和震害评估中的关键性科学问题,完成的主要研究工作及取得的创新成果如下:1.提出了一种多策略的社交媒体地震灾情数据获取方案,以新浪微博移动端为数据源,建立了我国大陆地区首个社交媒体地震灾情数据库及管理平台,为开展这一领域的研究工作奠定了重要基础。以我国现有的规模最大、用户最多的社交媒体平台新浪微博为例,总结分析了现有微博数据获取方法。在此基础上,提出了新浪微博商业API、网络爬虫、烈度衰减关系以及历史震例烈度分布矢量图相结合的多策略社交媒体地震灾情数据获取方案。基于新浪微博移动端,抓取了我国自2010年以来共206次破坏性地震震后72小时内与地震相关的微博数据,建立了我国大陆地区首个社交媒体地震灾情数据库及管理平台,并实现了数据可视化。同时,收集整理了我国大陆地区26次破坏性地震的烈度分布矢量图,在此基础上完成了位置微博的提取与地图匹配。本文所建立的数据库包含文本内容数据与用户关系数据,内容丰富、资料详实,便于下载使用,该数据库的建立为今后开展地震灾情获取和数据挖掘工作提供了宝贵的基础资料。2.基于社交媒体数据,分析了2010年以来我国大陆地区破坏性地震所呈现的灾情时间特征、空间分布特征、时空变化特征以及主题特征,挖掘得出了地震灾情的统计特征和分布规律。基于第三章获取的震后72小时微博数据进行了描述性挖掘,对于总体数据开展了时间分析和空间分析,对于位置微博数据基于热力图进行了时空特征变化的分析,并应用K-means方法做了主题聚类分析,掌握了不同的灾情主题分布情况和规律,较为全面地挖掘得出了近年来我国破坏性地震社交媒体端灾情数据的统计特征和规律。3.基于社交媒体数据,以机器学习中的人工神经网络算法为基础,建立了烈度快速评估模型,提出了一种数据驱动型的地震烈度快速评估方法。将机器学习中的多分类问题思想和文本挖掘方法引入到地震烈度快速评估中,提出了基于震后社交媒体数据的地震烈度快速评估方法的总体框架和流程。采用2010年至2018年的20次破坏性地震新浪微博数据为样本,构建微博文本数据的特征向量矩阵,建立数据与烈度分区之间的对应关系,将碎片化、半结构化的微博文本数据转化为可以作为分类问题输入的空间向量形式,形成机器学习所需的结构化的数据集,在人工神经网络算法的基础上训练出地震烈度快速评估模型。这一模型经测试集性能测试评估准确率可达81%,经实例分析评估准确率超过67%。本文所提出的这种数据驱动型的地震烈度快速评估方法,从时效性和精度上均可相对较好地满足地震应急救援的实际需求。本文的学术贡献和应用价值主要在于:在大数据时代开辟了地震灾情信息获取的一条新途径,为地震应急中的灾情快速获取与烈度快速评估提供了新的技术思路,提出了一种新的地震烈度快速评估方法,在地震应急救援和政府抗震救灾中将具有重要的应用价值。
【学位授予单位】:中国地震局工程力学研究所
【学位级别】:博士
【学位授予年份】:2018
【分类号】:P315.9
【图文】:

路线图,路线图,研究技术


本文研究技术路线图

社交,历程,媒体


中国地震局工程力学研究所博士学位论文信方式。经过多年的发展,越来越多的人愿意在社交媒体平台上发表自己的看法这也使得社交媒体数据成为了一种重要的数据源,它提供了大量有价值的信息,可以反映现实世界的各种社会活动(王艳东 等,2016)。图 2-1 详细描述了社交媒体的发展历程。

决策树,分类模型,贝叶斯网络,分类器


分类是一个两阶段过程,包括学习阶段(构建分类模型)和分类阶段,如图2-3 所示。学习阶段的主要任务是建立描述预先定义的数据类或概念集的分类器,并进行准确率的检验;分类阶段则基于学得的分类模型对新数据进行分类(李航,2011)。图 2-3 分类的两个阶段常见的分类模型(分类器)主要包括决策树、支持向量机、贝叶斯网络和神经网络等,下面对这些模型做简要介绍:(1) 决策树决策树利用树状结构来表达分类的流程,整个流程中涉及多次的判断。它从一组无次序、无规则的元组中归纳出一种分类规则,同时将这种分类规则用树状结构进行表示,因此十分简单明了。许多定性问题的表达都可以采用决策树来解决,它选取自上向下的递归方式,在决策树的内部结点进行属性值的比较,并?

【参考文献】

相关期刊论文 前10条

1 李立耀;孙鲁敬;杨家海;;社交网络研究综述[J];计算机科学;2015年11期

2 徐敬海;褚俊秀;聂高众;安基文;;基于位置微博的地震灾情提取[J];自然灾害学报;2015年05期

3 吴联仁;易兰丽;闫强;;危机事件下在线群体用户行为统计特征分析[J];情报科学;2015年10期

4 郭红梅;陈维锋;张莹;申源;;多源地震灾情信息融合的烈度判定方法研究[J];华北地震科学;2015年03期

5 伍育红;;聚类算法综述[J];计算机科学;2015年S1期

6 方滨兴;贾焰;韩毅;;社交网络分析核心科学问题、研究现状及未来展望[J];中国科学院院刊;2015年02期

7 孙晓;叶嘉麒;唐陈意;任福继;;基于多策略的新浪微博大数据抓取及应用[J];合肥工业大学学报(自然科学版);2014年10期

8 游翔;葛卫丽;;微博数据获取技术及展望[J];电子科技;2014年10期

9 朱立超;李治军;姜守旭;;基于位置的社交网络研究综述[J];智能计算机与应用;2014年04期

10 刘经南;方媛;郭迟;高柯夫;;位置大数据的分析处理研究进展[J];武汉大学学报(信息科学版);2014年04期

相关博士学位论文 前1条

1 田野;基于微博平台的事件趋势分析及预测研究[D];武汉大学;2012年



本文编号:2804395

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/diqiudizhi/2804395.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户c08d8***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com