面向标准格式的地理空间数据转换方法研究
1 绪论
1.1 研究背景与意义
随着数字城市的发展和应用,地理空间数据在城市基础地理信息数据库的建设以及国民经济发展中发挥了越来越重要的作用[1,2]。地理数据来源主要包括以下几种方式:野外测量数据、现有纸质地图的扫描数字化、遥感影像数据、统计资料等[3],由于地理数据获取手段的多样性、各 GIS 软件处理系统对地理要素的分层、分类的定义与理解不完全相同,导致各行各业生产的数据格式和结构存在差异性,从而造成同一种类型的地理数据在不同的部门和行业无法得到共享利用的问题[3,4]。 地形图的绘制、土地数据调查、地籍成图一般是使用 CAD 软件平台进行矢量化操作。但由于 CAD 数据并没有严格的地理数据分层概念,其可以将点、线、面数据混合存放在一个图层中[5],且 AutoCAD 地形图数据的地理要素编码方式并不符合国标规定[6,7],这种分层、编码方式导致 DWG 格式的地理数据难以进行拓扑查询、空间分析等操作。由于 GIS 数据以空间数据库的形式进行存储和管理,在图形数据处理与拓扑关系重建等方面遵循一定的规则,能很好的进行专题地图绘制、网络分析和叠置分析。从人类对事物认知的过程来讲,CAD 系统侧重于对客观不存在的事物进行规划设计,而 GIS 系统主要用于对现实存在事物的建模,对有关地理数据进行管理、分析和描述,从而为用户活动提供信息支持与服务[8,9]。为适应数据管理与应用的需求,如何将已有的大量 CAD 格式数据转为 GIS 格式的数据,进而更好地管理和使用地理数据资源,提高数据的使用效率,就成为我们迫切需要解决的技术问题[10]。 在数据转换研究领域,许多学者对数据转换方法进行了研究并得出了较多的研究成果,本文对传统的几种数据转换方法进行了对比分析发现,传统的数据转换方法主要存在两类问题:第一,传统的数据转换方法较多限于同构数据间的转换,这种转换理论易造成数据信息的丢失等问题,且转换功能单一难以根据实际需要进行模型的定制;第二,传统的数据转换方法研究的主要目的是实现数据格式的转换,而对源数据的要素分类与编码的标准化转换研究却很少,在“数字城市”基础地理空间数据框架建设与发展的大背景下,地理数据标准化建设显得尤为重要,显然传统的数据转换理论已难以满足地理信息技术的发展需求。如何实现地理数据“无损转换”的同时实现对源数据要素的分层与编码体系的标准化是本文研究的重点内容。
........
1.2 国内外研究及应用现状
研究面向标准格式的地理空间数据转换方法,主要从数据标准的制定、数据格式特点以及数据转换方法等方面进行研究。各研究领域的研究现状和趋势如下:为开展地理空间信息的国际标准化工作并利于地理数据标准的推广,国际标准化组织(ISO)于 1994 年成立了地理信息标准化技术委员会(ISO/TC 211) [12]这一机构,其主要任务是对地理空间数据的定义、描述和管理工作制定一系列的标准,并对不同用户、系统和平台间管理地理信息的方法、工具和服务提供说明 [13]。OGIS 实质是一套独立于具体平台和系统的公共空间数据处理函数,可应用于任何平台和系统,使得用户可以在单一的工作环境流程中,该标准适用分布于网上的任何地理空间数据。但由于 OGIS 函数集不能为各层次和各领域的空间数据转换提供统一标准,不能完全解决数据分布与集中处理等问题,因此借助该标准实现数据转换与集成存在一定的问题 [14]。所以后来,很多 CAD 与 GIS 软件平台都提供了特定模型的数据格式作为交换的媒介,如南方CASS 的 DWG/DXF、ArcInfo 的 EOO、MapGIS 的 SUV 格式。但是,由于软件平台种类繁多,不能满足某个系统软件的数据交换格式能适用于其他所有系统。为了使数据交换更加方便,减少数据转换造成的信息损失,许多国家或地区制定了地理空间数据的转换与共享标准,如美国国防高级研究项目局、国防建模仿真局等联合发起的综合环境数据表示与交换规范 (SEDRIS) 项目,美国国家空间数据协会制定的空间数据转换标准(SDTF),其他类似标准还有欧洲的 DGIWG 的数字图形信息交换标准(DIGEST),澳大利亚的 ASDTS、加拿大的空间档案交换格式(SAIF)、英国的 NTF等[15]。
.............
2 地理空间数据相关格式分析
地理空间数据的格式主要包括地理要素的分层与编码规则这两个方面,由于不同软件生产开发商规定的要素分类体系相差较大,导致不同软件系统的数据组织形式、拓扑关系、图形符号表达也各不相同。要实现地理数据的共享与集成,避免数据孤岛,减少数据资源浪费的一个重要途径就是实现海量基础地理数据的标准化转换。研究面向标准格式的地理数据转换,首先需对标准格式的地理数据结构进行深入的了解,再结合对广泛应用的 AutoCAD 与 ArcGIS 软件平台数据格式的分析,完成面向标准格式的数据转换模型的构建,从而实现地理数据的标准化转换工作。
2.1 地理空间数据标准格式
为实现地理数据格式统一,实现数据的标准化转换入库,本文提出了面向标准格式的地理数据转换新方法,论文研究的一个重要内容是地理数据的标准格式,即国标规定的《基础地理信息要素分类与代码》[6]标准。 随着我国地理信息技术的迅速发展,各相关部门都在积极的开展基础地理信息数据库的建设,形成了很多行业和地方性的数据改造入库标准,测绘行业标准如《测绘技术设计规定》(CH/T 1004-2005),地方标准如《宁波市 1:500 1:1000 1:2000数字地形图图式》(DB3302/T1003-2004),而在省级的数据库建设中用于 1:10 000的地理要素分类与编码标准多达 4 种,随着时间的推移,各省自订的标准会越来越多且标准间的差异呈增大趋势。各地区标准的不统一横向上体现为区域地理要素的分层、编码差别较大,纵向上表现为不同尺度的地理空间数据所表示的地理空间信息与属性含义存在不一致等问题,这种问题势必会影响地理空间数据的标准化改造入库进程,不利于基础地理数据入库建设的发展[27]。
...........
2.2 AutoCAD 与 ArcGIS 数据格式特点
GIS 与 CAD 数据是在空间坐标系统的基础上,通过目标与参考系统的联系,来呈现图形要素间的空间关系,并对图形的属性信息和空间信息进行处理[31]。研究 GIS 与 CAD 系统的数据转换,不仅研究两者的数据格式转换,更重要的是图形内容与属性信息的转换。因此,要实现 GIS 与 CAD 数据的转换,首先需对两种数据的格式特点进行深入了解与分析。空间数据包括图形信息和属性信息两方面,地理数据的图形信息不仅是属性信息的载体也是 GIS 与 CAD 数据转换的基础。地理数据的属性信息包括图形要素编码和业务登记信息,其中,业务登记信息包括如用途、方向等内容,图形的属性信息是对要素特性的描述。表 2.3 是 GIS 与 CAD 数据的特征比较[32]。本章节从数据结构特点、数据组织形式、拓扑关系、坐标系统和图形符号表达这五个角度来论述 ArcGIS 与 AutoCAD 数据的格式特点。
.......
3 非标准格式的数据转换 ....... 25
3.1 基于转换程序的数据转换 ............. 25
3.2 基于公开数据格式的数据转换 ..... 26
3.3 基于直接访问的数据转换 ............. 27
3.4 FME 传统的数据转换技术 ............ 27
本章总结 ....... 28
4 面向标准格式的数据转换模型设计 ....... 29
4.1 面向标准格式的语义转换技术设计 ....... 29
4.2 要素重分类分层对照表构建 ......... 32
4.3 要素编码转换映射表构建 ............. 35
4.4 面向标准格式的数据转换模型构建 ....... 38
本章小结 ....... 40
5 面向标准格式的地理数据转换实现 ....... 41
5.1 数据预处理 ....... 41
5.1.1 数据存在的质量问题 ........... 41
5.1.2 预处理标准 ...... 42
5.1.3 质量控制预处理方法 .......... 43
5.2 基础地理数据转换的实现 ............. 45
本章总结 ........ 46
6 数据转换成果质量评价与分析
当前,国内外关于地理数据转换成果精度验证的研究较为少见,但缺少准确可信的成果数据质量评价准则,不利于地理空间数据转换与共享技术的发展,也对 GIS应用、管理和辅助决策功能的正确性与可靠性有着直接的影响[67,68]。为保证成果数据的质量,使转换得到的目标地理数据库地理要素的空间数据、属性内容、空间关系等数据信息与原图保持一致,且满足基础地理数据库建库要求,需对 GIS 格式的MDB 成果数据进行质量评价分析。 数据质量评价一般采用直接质量评价和间接质量评价方法,两种方法的区别在于直接评价是对对象数据直接进行人工检测,随机抽样或者建立评价模型进行质量检查,间接的质量评价方法是根据相关知识或信息进行演绎推理来确定数据质量,在实际操作中,一般优先选择直接质量评价的方法,或以直接质量评价为主,间接评价方法为辅[68]。鉴于本项目的特点,论文采用直接质量评价的检查方法,提出了随机抽样和基于 kappa 系数的两种成果数据检查方案。
6.1 随机抽样的检查方法
对数据转换成果进行抽样检查的基本思路是,以源 CASS 数据图件为对照样本对随机抽取要素的地物名称与类型、空间坐标、图层分类信息、属性内容、地理编码等信息进行对比统计分析与检查,得出表 6.1 所示随机抽样的结果。由随机抽样的结果可知,论文采用的基于 FME 语义映射的数据转换技术得到的目标地理数据库,其地理要素的空间坐标、属性信息与源 CASS 数据保持了一致,,且完成了源数据地理要素的分类分层和编码体系的标准化转换,实现了基础地理数据的转换与标准化改造。对转换未成功的要素进行逐一分析得出,其原因包括三个方面:源数据成图质量不高如块状地物不封闭、成图操作不规范造成要素编码错误以及自动化转换前进行 CASS 数据的整理操作过程中遗漏了待处理的要素。因此,控制源 CASS 数据的成图质量,做好源数据的整理检查工作是提高数据转换成果质量的重要条件。
.........
结论
随着地理信息技术的不断发展和 GIS 应用的普及,各数据源的 CAD 与 GIS 数据整合应用趋势越来越明显,两种主流格式数据的转换就成了我们亟待解决的问题。 本文从 AutoCAD 和 ArcGIS 这两种软件入手,对两大主流软件平台所支持的数据格式进行了深入分析,基于传统非标准格式数据转换方法不足,提出了面向标准格式的地理数据转换新方法,对源 CASS DWG 数据进行“无损转换”和标准化改造入库工作,结合项目实践,进行了实例论证,并对数据转换成果质量进行了评价与分析。论文主要完成了以下几个方面的工作:
① 对标准地理数据格式进行了进行了较为深入的研究与介绍,并从数据结构、组织形式、拓扑关系、坐标系统和图形符号表达这五个角度对 AutoCAD 与 ArcGIS这两种软件的数据格式特点进行了分析。
② 对几种传统非标准格式的地理数据转换方法进行了总结得出,传统的地理数据转换方法主要研究的是非标准格式数据间的转换,难以实现地理数据标准化转换入库操作,而且易造成数据信息的丢失。
③ 基于传统数据转换方法的不足,本文提出面向标准格式的地理数据转换新方法,是本文的一大创新之处。根据标准地理数据格式建立源地理数据要素重分类分层对照表和编码转换映射表,利用语义转换技术加载映射表,实现了 CASS DWG数据的“无损转换”和标准化改造入库工作,解决了传统数据转换方法无法满足地理数据标准化建库需求等问题,对促进我国基础地理信息标准化建设具有很重要的应用价值。
.........
参考文献(略)
本文编号:58545
本文链接:https://www.wllwen.com/wenshubaike/lwfw/58545.html