当前位置:主页 > 科技论文 > 测绘论文 >

地理资源知识关联工具研究与实现

发布时间:2020-10-20 16:54
   随着科学技术的发展,数据库系统可以进行数据的高效录入、修改、查询、统计等功能,但很难发现隐藏在数据背后的知识、空间关系等。在大数据背景下,涌现了很多知识服务系统,却不能很好地利用海量的地理空间大数据,挖掘数据背后的隐式地理信息。地理资源与地图信息专业知识服务系统作为专业领域的知识服务系统,实现地理资源知识挖掘与发现、知识集成等功能,对我国的工程科技、科学研究和社会经济发展具有重要意义。地理资源知识关联工具是构建地理资源与地图信息专业知识服务系统的核心基础。其中,关联对象主要是地理资源信息专业知识,其来源广泛,需要通过分析知识来源,设计知识表达模型进行关联知识提取和整理。地理资源知识关联工具的研究目的在于为知识服务系统提供知识检索、知识集成、知识挖掘等功能的技术支持,为知识服务系统提供高性能的地图知识服务奠定基础。实现地理资源知识关联工具最核心的问题是要实现空间知识关联算法。目前有很多针对文本的知识关联研究和关联算法,特别是图书情报等领域,但适用于地理信息的空间知识关联算法和工具仍然比较缺乏,针对这方面的研究仍然有很大的研究空间。本文从地理资源知识来源、空间表达模型、关联算法、关联工具系统设计与实现等方面进行了相关研究。首先对地理资源知识关联技术涉及的相关理论和技术进行了研究和探讨,讨论了地理资源信息专业知识来源及知识体系,空间知识分类及形式化表达,自然语言处理理论与技术以及中文地名地址匹配等问题,并对地理本体进行了探讨。根据对这些理论的研究和探讨,设计了地理资源专题知识发现及专题空间知识表达模型,以提高对本体的利用效率,并对地理本体进行推理扩展,使本体中隐藏的知识显式化。文中借鉴国内外对知识关联算法的研究成果,分析了现有的知识关联算法,并对现有的语义相似度关联算法进行改进,从空间关联语义、时间关联语义、信息关联语义等方面,设计了针对地理资源知识空间表达模型的关联算法,充分利用本体良好的层次语义关系,实现空间知识关联计算,并通过实验比较了基于模型的算法与传统知识关联算的通用性,设计的算法得到的结果更加接近专家经验知识,能够满足项目需要,为关联工具的实现奠定了基础。并根据设计的算法,对地理资源知识关联工具原型系统进行了实现,探讨了原型系统的总体架构和总体设计,并对系统的功能模块进行了阐述。
【学位单位】:中国矿业大学
【学位级别】:硕士
【学位年份】:2018
【中图分类】:P208
【部分图文】:

要素结构,中文,地址,示例


是地理资源信息的中文自然语言表现形式之一,为此对中文地名地址进行关联分析和计算,特别是地名地址匹配问题的解决,对建立地理资源知识关联工具具有非常重要的意义。与英文地名地址不同,中文地名地址是连续的字符串,但也具有一定的结构,由一些地址要素组成,分析中文地名地址要素构成,有利于采用合理的中文地名地址匹配方法。2.4.1 中文地名地址要素解析中文地名地址一般主要由行政要素、基本约束信息和位置信息等要素构成,具体表述如下[68]:标准地址 :: 行政要素 基本约束信息 位置信息行政要素 : 国家 城市 行政区县基本约束信息 : 街道 集镇 工业区 自然村位置信息 : 建筑物编号 门牌号 标志物如图 2-5 所示,以“江苏省徐州市泉山区大学路一号中国矿业大学南湖校区环境与测绘学院 C404”为实例说明中文地址的结构要素。行政要素 基本约束信息 位置信息

平台机构,示例,数据,占比


图 4-5 万方平台机构数据示例Figure 4-5 Sample of organization data by WanFang对万方平台的 3654 条未经处理的机构数据,以地址匹配、机构成立时间、机构简介信息等为基本关联对象进行结果计算,并建立标准机构库和地址库作为匹配源进行关联度匹配计算,结果如表 4-2 所示。表 4-2 实验结果统计Table 4-2 Statistic of experiment results关联类型 关联结果 单项占比(%) 总占比(%)成功匹配结果 完全匹配 2594 条 71.083.9(共 3067 条) 模糊匹配 473 条 12.9无法匹配结果 过于模糊 539 条 14.816.1(共 587 条) 错误结果 48 条 1.3根据实验结果可以得出,成功匹配结果的成功率达到了 83.9%,说明该算法基本能够满足知识关联计算的要求,能够满足项目的基本需要。在成功处理结果中,完全匹配结果占比 71.0%,主要是因为要素信息比较完整,比较容易得到正确结果;对于模糊结果占比 12.9%,大多是因为描述信息存在歧义或者少量要素

用户界面,数据搜索,用户数据,模块


图 5-4 用户界面Figure 5-4 User interface(2)用户数据模块:该模块运行与服务器端。接收到用户数据后,将数据进行存储和格式转换,形成资源数据集。此外对用户数据进行初步的数据分析,为下一步数据搜索做准备。(3)数据搜索模块:数据搜索模块是从 LinkedData 中获取目标数据集。由于 Linked Data 数据众多,需要从当中筛选所需要的数据集。根据上一步中获得的用户数据信息,编写 SPARQL 语言搜索。搜索结果形成目标数据集。知识检索模块如图 5-5 所示。
【参考文献】

相关期刊论文 前10条

1 高继平;丁堃;潘云涛;袁军鹏;;知识关联研究述评[J];情报理论与实践;2015年08期

2 张艺雪;黄毅杰;;一种基于MapReduce的Apriori改进算法研究[J];兰州工业学院学报;2014年06期

3 吴烨;陈荦;熊伟;钟志农;景宁;;面向高效检索的多源地理空间数据关联模型[J];计算机学报;2014年09期

4 吕欢欢;宋伟东;;多元地址要素组合的地址匹配方法[J];测绘科学;2015年03期

5 李清泉;李德仁;;大数据GIS[J];武汉大学学报(信息科学版);2014年06期

6 刘纪平;张福浩;王亮;董春;王勇;徐胜华;钱新林;;面向大数据的空间信息决策支持服务研究与展望[J];测绘科学;2014年05期

7 吉根林;赵斌;;面向大数据的时空数据挖掘综述[J];南京师大学报(自然科学版);2014年01期

8 李楠;张学福;;基于关联数据的知识发现模型研究[J];图书馆学研究;2013年01期

9 刘大有;陈慧灵;齐红;杨博;;时空数据挖掘研究进展[J];计算机研究与发展;2013年02期

10 罗名海;;信息时代地理信息服务方式的转变[J];地理空间信息;2011年06期



本文编号:2848922

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/dizhicehuilunwen/2848922.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户7efdf***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com