油气田勘探开发生产中的数据治理方法与技术研究
发布时间:2020-03-19 05:59
【摘要】:油气田数据经过近20年来的建设,将油气田企业几十年甚至百年积攒的纸质文档、报告与图件全部数字化入库,建立了各类数据中心,完成了油气田互联网、物联网等建设,为数据数字化和数据共享提供了保障。由于油气田企业数据建设是一个漫长的过程,在建设中采取多期次、多厂商、多技术、多方法等多元化建设方式,这样的建设方式产生了数据“孤岛”和“碎片化”的问题。数据治理是近年来提出了解决数据“孤岛”问题的一个数据治理工程,是将在IT思维条件下建立的数据,要用DT思维来重新构建,将数据“盘活”,实现更便捷的数据访问。针对油气田现实中的数据问题,必须实施数据治理工程,对原有存在的数据一次全新的改造。本文将数据治理作为研究对象,先后对数据治理的基本思想、理念和数据治理的内涵、外延及各种观点做了探讨,重点对油气田数据治理的理论方法与关键技术研究,并将所研究的理论方法与开发的技术在相关油气田做了应用。本文研究的主要内容如下:1)主要对数据治理概念、前人研究成果以及数据治理的基本观点、方法做了研究,构建了油气田数据治理的基本体系,给出数据治理的基本模型,重点是研究了数据治理的方法问题。2)在研究油气田开发数据治理的理论的基础上,研究了数据治理中数据驱动的工作流建模技术、数据清洗技术、相关性搜索等三个关键技术问题,通过这些技术的研究为数据治理软件的编写提供了理论和技术支撑。3)本文设计了一套数据治理软件系统,这套软件主要采用可视化流程编程技术,专业人员只需要对相应的工具节点进行组合不要编程就能够编制数据处理和应用的工作流,编制好的工作流可以在本地机器上运行,也可以放在云端自动运行后者根据条件触发运行。4)应用本文提出的油气田数据治理理论、模型和方法,选择了半结构化历史数据入库、自助式数据分析和数据应用等常见应用场景,验证了本问题所提出的数据治理方法的可行性和本文所涉及的软件的高效率,为以后类似的数据治理工作提供了参考。本文研究中所获得创新点有如下三点:1)提出了油气田勘探开发生产中的数据治理模型。通过研究从数据治理的提出与数据治理的基本观点到数据治理的基本方法,构建了油气田数据治理的基本体系,提出了油气田数据治理模型,勾画出了油气田数据治理的基本路线图。2)设计了一套具有“零编程、流程化、节点操作、场景式、可视化”特点的用于数据治理工作的软件系统。在研究油气田数据治理关键技术的基础上,本文是的软件系统能够根据用户场景需求组织数据与编制业务流程,通过可视化的节点组合来完成数据的获取、组织、整合、提纯及有形化表达。本套软件在整体设计上遵循零代码原则,用户不需要了解复杂的编程技术,仅需要排列和组合各种功能节点,即可实现对海量多源异构数据的整合与应用。3)探索出油田数据治理的新模式。通过在油气田数据治理工程中使用本文提出的数据治理模型和应用本文研制的软件,解决了长庆油田的复杂历史数据整理入库、长城钻探数据治理与大庆油田的专项数据治理工程等油气田多个领域的数据治理问题,形成了油田数据治理的新模式。总之,数据治理是当前油气田企业数据应用和大数据技术应用的一个重要难题,油田企业要使油气田数据发挥重要作用,让数据创造价值,就必须实施完全的、彻底的数据治理工作。
【图文】:
长安大学博士学位论文目前油田数据最大的问题是数据“碎片化”与数据“鸿沟”。在进行了长达十几年数字油田数据建设,油田企业将油田企业几十年,甚至百年以来积攒的纸质数据,也是人们常说的“资料”全部数字化入库,完成了“资料”的数字化管理。同时,还将产过程数字化,实现数据正常化管理。可是,,十几年来的数据建设成果并没有人们想的那么好。不但没有消除用 80%的时间找“资料”(数据),用 20%的时间做研究的问,反而大量的数据存储带来了更多的能源(电力)消耗,造成了数据高成本、低价值题日益严重。[6]
第一章 绪论点与特殊性,数据数字化与数字化数据基本都是在探问题,就是石油数据库建设出现了多期次、多商家、人们再回过头去看,发现之前数据建设的比较凌乱,最主要的表现就是数据的“碎片化”与“鸿沟”太深”,就是没有将数据作为一个整体来建设,换句话说就遇到什么问题解决什么问题,遇到什么数据建设什发现存在的问题一大堆,如数据的零散、凌乱、不成据碎片化如图 1.2 所示。
【学位授予单位】:长安大学
【学位级别】:博士
【学位授予年份】:2018
【分类号】:TE34;P618.13
【图文】:
长安大学博士学位论文目前油田数据最大的问题是数据“碎片化”与数据“鸿沟”。在进行了长达十几年数字油田数据建设,油田企业将油田企业几十年,甚至百年以来积攒的纸质数据,也是人们常说的“资料”全部数字化入库,完成了“资料”的数字化管理。同时,还将产过程数字化,实现数据正常化管理。可是,,十几年来的数据建设成果并没有人们想的那么好。不但没有消除用 80%的时间找“资料”(数据),用 20%的时间做研究的问,反而大量的数据存储带来了更多的能源(电力)消耗,造成了数据高成本、低价值题日益严重。[6]
第一章 绪论点与特殊性,数据数字化与数字化数据基本都是在探问题,就是石油数据库建设出现了多期次、多商家、人们再回过头去看,发现之前数据建设的比较凌乱,最主要的表现就是数据的“碎片化”与“鸿沟”太深”,就是没有将数据作为一个整体来建设,换句话说就遇到什么问题解决什么问题,遇到什么数据建设什发现存在的问题一大堆,如数据的零散、凌乱、不成据碎片化如图 1.2 所示。
【学位授予单位】:长安大学
【学位级别】:博士
【学位授予年份】:2018
【分类号】:TE34;P618.13
【相似文献】
相关期刊论文 前10条
1 张谦,蔡虹;3D数据场的可视化技术[J];计算机工程;1998年05期
2 米丽萍,陈礼民;规则数据场相关性的光线投射算法[J];山西大学学报(自然科学版);2001年02期
3 梁训东,刘慎权;基于特征的时间序列数据场可视化方法[J];软件学报;1996年09期
4 董峰,蔡文立,陈天洲,石教英;从物理模型重构三维体数据场[J];软件学报;1997年11期
5 查诚;陶华伟;张昕然;周琳;赵力;杨平;;一种新的结合情感数据场和蚁群策略的语音情感识别算法(英文)[J];Journal of Southeast University(English Edition);2016年02期
6 王博;孙玉坤;嵇小辅;;基于数据场聚类的模糊神经网络在发酵过程中的应用[J];仪器仪表学报;2009年05期
7 陈礼民,梁晓辉,邵志东;基于数据场相关性的光线投射算法[J];中国图象图形学报;1999年09期
8 陈莉,彭群生;加速的三维不规则数据场剖面绘制技术[J];浙江大学学报(自然科学版);1997年03期
9 郝宁波;魏长宝;田l
本文编号:2589812
本文链接:https://www.wllwen.com/kejilunwen/shiyounenyuanlunwen/2589812.html