当前位置:主页 > 科技论文 > 测绘论文 >

基于概念格的多源POI分类体系融合研究

发布时间:2019-11-19 02:27
【摘要】:随着互联网的不断发展进步,早期Google Earth、互联网瓦片地图带给人们的新鲜感逐渐下降,电子地图仅满足浏览需求或者作为背景的时代已经过去,人们对地理位置服务提出了更高的需求,地图也亟需融入到大众的日常生活中。伴随着以位置服务为核心的“信息时代”的到来,位置服务成为学术界和产业界的研究热点,兴趣点(POI)数据是网络电子地图的最重要内容,也是互联网位置服务的立足之本。由于互联网上的POI数据来源不一,目前各主流的网络POI数据服务商,如ESRI、Google、天地图、百度、高德、腾讯等,都对POI数据进行了分类管理。但由于现阶段并没有统一的POI分类标准及分类体系,使得各网站POI数据提供商各自根据一定规范制定了相应的POI数据分类体系,导致网络上POI数据分类信息的名称及其包含的语义信息并不完全相同,无法直接进行比较与匹配,严重降低了网络POI的数据价值。本文引用概念格相关原理技术作为支撑,以深度学习的方法提取了POI地址中的语义因子,采用以同义词词林为基础的手段来实现POI分类语义因子的合并与优化,再通过不同分类体系中分类概念之间形式背景矩阵的构建,并以此为基础,利用Chein算法自动生成POI分类体系的概念格,实现网络POI分类体系的相互关联和映射。本文以Google、天地图、百度、高德等互联网公司的数据和分类标准作为实验数据,最终生成了一个可扩展、可兼容和更新的新的分类体系,实验证明,新的分类体系有着良好的效果,达到了预期目标。主要的工作内容和创新点:(1)生成一个新的POI分类体系,并且对来自多源POI分类体系的变化做到可兼容,可扩展,可更新;(2)提出了一种基于深度学习算法的POI地址切分算法;(3)实现网络多源POI分类体系的相互关联和映射。
【图文】:

算法,精度,对词,程序


图 3.6 切分程序展示以上实验可以看出,本文算法在精度上较传统 FMM 算法有较大程度提升的地址越多,,精度也越高,同时减低了对词典的依赖,但是效率有所降低

部分内容,特征词,扩展版


4 分类语义因子合并与优化4.1 引言过第三章的语义因子提取处理之后,得到了 POI 的特征词,但是在这些处理后中经常会出现如“健身房”与“健身馆”、“茶楼”与“茶馆”、“茶社”等词语相近或义的特征词,或者在汉语原意中有一词多义的特征词以及某些具有强关联的特时候就必须对得到的特征词集合进行合并与优化处理。为此,本节采用基于同的特征词优化方法。文选取《同义词词林扩展版》作为同义词词典进行同义词合并处理。该词典最家驹等于 1983 年编纂而成,后经过哈尔滨工业大学信息检索实验室重新扩展形成一部具有汉语大词表的“哈工大信息检索研究室同义词词林扩展版”——《林扩展版》,词典中的内容主要包括一个词语的同义词以及一定数量的同类词录词语超过 7 万条,其部分内容如下图 4.1 所示。
【学位授予单位】:兰州交通大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:P208

【参考文献】

相关期刊论文 前10条

1 陈芊希;范磊;;基于深度学习的网页分类算法研究[J];微型电脑应用;2016年02期

2 徐笋晶;李赛美;刘敏;刘超男;刘煜洲;李日东;;基于属性偏序表示原理的经方方证研究[J];燕山大学学报;2014年05期

3 曾子维;王鑫;马垣;;基于概念格中紧致依赖的空间数据挖掘方法研究[J];计算机应用与软件;2014年02期

4 易茹兰;徐枫;邓敏;刘启亮;;利用形式概念分析的海岛语义层次分类方法[J];武汉大学学报(信息科学版);2012年08期

5 郑艳红;张东站;;基于同义词词林的文本特征选择方法[J];厦门大学学报(自然科学版);2012年02期

6 郑金英;滕春霞;;概念格构造算法的现状与发展前景[J];硅谷;2011年22期

7 程昌秀;于滨;;一种基于规则的模糊中文地址分词匹配方法[J];地理与地理信息科学;2011年03期

8 金梁;;基于属性涵盖的概念格构造算法[J];襄樊职业技术学院学报;2011年01期

9 卢媛媛;何海燕;张剑;;电子商务搜索引擎中文分词算法分析[J];信息网络安全;2010年08期

10 马垣;张果枝;张仁秋;;基于粒化的形式背景的概念格研究[J];计算机应用与软件;2010年07期

相关硕士学位论文 前10条

1 陈瑞;基于多源POI数据的匹配融合方法研究[D];兰州交通大学;2014年

2 牛秀萍;基于隐马尔科夫模型词性标注的研究[D];太原理工大学;2013年

3 王良芳;文本挖掘关键词提取算法的研究[D];浙江工业大学;2013年

4 纪彤坤;概念格Chein算法的研究与改进[D];华南理工大学;2012年

5 刁毓;基于本体的中文分词算法的研究与实现[D];曲阜师范大学;2012年

6 李明;针对特定领域的中文新词发现技术研究[D];南京航空航天大学;2012年

7 申乐;概念格剪枝方法研究及其在Web挖掘中的应用[D];郑州大学;2011年

8 王培培;基于区别度概念格的关联规则挖掘算法设计[D];河南大学;2010年

9 张智星;概念格的几种生成算法[D];河北大学;2010年

10 王欣欣;频繁加权概念格及天体光谱关联知识挖掘系统[D];太原科技大学;2009年



本文编号:2562883

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/dizhicehuilunwen/2562883.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户b8c40***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com