当前位置:主页 > 理工论文 > 化学工业论文 >

基于Spark的易制毒化学品数据分析系统的设计与实现

发布时间:2020-06-09 13:15
【摘要】:现有的《易制毒化学品信息监管系统》每天产生大量交易申报记录,传统的集中式数据分析方式无法适应于实时分析需求,存在分析结论有限、时间延迟高等问题。全面应用大数据的相关技术和资源,是提升监管部门监管能力的有效手段,有助于监管部门全面搜集与应用易制毒化学品交易数据,为精确的掌握市场的动态需求提供了可能。本文针对易制毒化学品海量数据实时处理问题和行业内对于易制毒化学品价格预测的实际需求,设计并实现了一套基于Spark的数据分析系统,该系统即可以根据实时交易数据对易制毒化学品的交易情况进行实时分析;也能够对易制毒化学品的价格进行短期预测。采用大数据生态圈内的较为流行的技术方案如Kafka,Flume等,降低了系统开发和维护的复杂性,为进一步的业务拓展奠定了基础。本文主要工作如下:(1)设计并实现了基于Spark的《易制毒化学品数据分析系统》,主要包括ETL模块、数据分析模块和可视化模块。能够对来自多省市的易制毒化学品交易数据进行实时采集,对采集来的数据进行清洗、统计、存储等工作,方便用户查询易制毒化学品实时交易情况。(2)针对易制毒化学品业务中可能存在的实时数据流峰值情况,结合反压机制,对数据流批次间隔的调整提出了优化策略,解决了短时负载高峰导致系统延迟过高的问题。(3)针对企业和监管部门希望能够对易制毒化学品的价格进行短期预测的实际需求,本文应用Spark ML机器学习库,对常用的三种回归分析算法进行了实验,并对结果进行了对比,以均方误差为评价指标,选取了保序回归算法为本系统价格预测的算法。
【图文】:

生态圈


高效的计算工具,包含用作 SQL 与结构化数据操作的 Spark SQL、用于机器学习的ib、用于图形处理的 GraphX 和 Spark Streaming。Spark 通常用来构建大型的低延据分析系统,处理场景主要包括复杂的批量处理和实时数据流的数据处理。Spark 创建目的是为了更好地支持分布式数据集上的迭代计算,也是对 Hadoop 的补Spark 可以在 Hadoop 分布式文件系统中并行运行,Spark 与 Hadoop MapReduce 类但相较于 MapReduce,Spark 是基于内存的并行大数据框架,这样它的处理输出结以直接保存在内存之中,因此 Spark 更适合需要使用数据迭代的场景,例如数据挖机器学习等,另外 MapReduce 总是消耗大量的时间排序,而 Spark 能够避免不必要序,减少系统的开销。Hadoop 提供了 map 和 reduce 两种处理数据的接口,,而 Spa函数式编程范式支持更多对数据处理的接口。Spark 作为大数据应用领域的热门技术之一,具有实时数据分析、机器学习等复杂方式,是如今大数据实时处理和分析技术中不可或缺的一部分。图 2.1 为 Spark 生主要技术。

独立进程,集运,主程序,应用程序


Mesos 作为资源调度的模式,通过调动 Job(SparkContext 提交的具体 Action操作)实现 Spark 功能程序的运算,这类功能程序可选自各类组件, Spark Submit 批处理模式、Spark Streaming 实时处理功能、Spark SQL 的架构化数据互操作、BlinkDB 的权衡查询、机器学习 MLlib、图计算 GraphX 和 SparkR 的数学计算等。Spark 具有高可伸缩性、高容错性和基于内存计算等特性。2.1.2 集群模型Spark 在分布式环境中采用主从结构,集群中由驱动器节点负责协调各个节点,称为Driver,Driver程序负责启动多个Worker节点,Worker节点也称为执行器节点,Worker节点从文件系统加载数据并产生 RDD(RDD 是用来存储数据的数据结构,Spark 的操作基于 RDD),同时按照不同的分区 Cache 到内存中,图 2.2 表示 Spark 运行步骤。
【学位授予单位】:河北师范大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TQ072;TP311.13

【相似文献】

相关期刊论文 前10条

1 杨盛平;;将易制毒化学品管理重点落到流通领域[J];上海化工;2019年02期

2 赵云飞;;易制毒化学品查缉管控的难点和对策[J];云南警官学院学报;2017年06期

3 陆建东;;上海市发布易制毒化学品管理现状调研报告[J];上海化工;2018年01期

4 闻摘;;五种化学制剂列入易制毒化学品目录[J];上海化工;2018年01期

5 张秀凤;;上海发布首份易制毒化学品报告[J];中国石油和化工;2018年02期

6 杨盛平;;强化易制毒化学品管理要形成联勤联动机制[J];上海化工;2018年04期

7 ;加强易制毒化学品监管必须做到 盯紧四要素 抓住八环节 落实四措施[J];上海化工;2018年07期

8 周亚宾;华进;陈彤;李洪军;贺稚非;;规范高校易制毒化学品安全管理的对策研究[J];西南师范大学学报(自然科学版);2018年10期

9 杨平;;非法进出口易制毒化学品案件侦防对策研究——以国际核查为视角[J];犯罪研究;2018年05期

10 ;发挥信息技术优势 杭州新锐信息公司为易制毒化学品管理提供信息服务[J];上海化工;2016年12期

相关会议论文 前8条

1 耿莹莹;李亚飞;刘湘祁;王红球;易裕民;;便携式拉曼光谱仪在毒品和易制毒化学品快速检测中的应用[A];第十七届全国光散射学术会议摘要文集[C];2013年

2 尹小丹;李文君;;化学与易制毒化学品[A];中国化学会第二十五届学术年会论文摘要集(下册)[C];2006年

3 姚依妍;;浅谈化学知识在易制毒化学品查缉中的运用[A];公共安全中的化学问题研究进展(第三卷)[C];2013年

4 李金璐;;试论易制毒化学品犯罪的防控对策[A];公共安全中的化学问题研究进展(第二卷)[C];2011年

5 李文君;聂鹏;;化学与禁毒[A];中国化学会第26届学术年会化学与社会论坛论文集[C];2008年

6 李佳;黄迎;徐雯丽;胡静;蒋舒仰;凌敏;姚建华;;易制毒化学品信息管理的策略[A];公共安全中的化学问题研究进展(第三卷)[C];2013年

7 刘嵩岩;;我国易制毒化学品管控体系建设研究[A];公共安全中的化学问题研究进展(第三卷)[C];2013年

8 李佳;姚建华;;苯丙胺类化学品合成反应理论研究[A];中国化学会第29届学术年会摘要集——第29分会:公共安全化学[C];2014年

相关重要报纸文章 前10条

1 记者 赖婉莹;强化企业职工与学校师生防御毒品能力[N];东莞日报;2018年

2 国家禁毒办;中欧易制毒化学品管制合作双边会在比利时召开[N];中国禁毒报;2019年

3 浙江省禁毒委员会副主任 省公安厅党委委员、副厅长 政治部主任 刘静;积极构建全要素监管制毒物品体系[N];人民公安报;2019年

4 本报记者 宋米亚;全国人大代表魏春:加强易制毒化学品行政监管和综合治理[N];中国禁毒报;2019年

5 记者 邬春阳;中国欧盟共同研讨进一步强化易制毒化学品管制合作[N];人民公安报;2017年

6 ;中国欧盟在广东佛山研讨进一步强化易制毒化学品管制合作[N];中国禁毒报;2017年

7 通讯员 李全栋;山东强化易制毒化学品列管监管[N];中国禁毒报;2018年

8 苏公瑾;南京市部署推进易制毒化学品管制工作[N];中国禁毒报;2018年

9 张媛 杨佳林 记者 谢丽勋;缴毒2.4吨、易制毒化学品104吨[N];中国边防警察报;2018年

10 肖林 本报记者 谢丽勋;滇粤大追捕[N];中国边防警察报;2018年

相关博士学位论文 前1条

1 郝冬婕;毒品犯罪的现代发展与防控对策研究[D];大连海事大学;2012年

相关硕士学位论文 前10条

1 李涵硕;基于Spark的易制毒化学品数据分析系统的设计与实现[D];河北师范大学;2019年

2 成成;易制毒化学品管制研究[D];云南大学;2017年

3 何芳;我国制毒物品相关行为的刑法应对研究[D];江西财经大学;2019年

4 张睿杰;易制毒化学品交易行为分析系统的设计与实现[D];河北师范大学;2018年

5 刘章铭;易制毒化学品供应商推荐系统的设计与实现[D];河北师范大学;2018年

6 张秀丽;基于数据仓库的易制毒化学品分析系统的设计与实现[D];河北师范大学;2018年

7 陆W

本文编号:2704740


资料下载
论文发表

本文链接:https://www.wllwen.com/projectlw/hxgylw/2704740.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户3439e***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com