当前位置:主页 > 科技论文 > 测绘论文 >

检索词优化的深网POI数据自适应剖分获取方法研究

发布时间:2021-08-13 22:53
  兴趣点(point of interest,POI)数据是一种与大众生活密切相关的地理信息资源,并成功应用在城市规划、地图导航等领域。随着移动网络、物联网等技术的快速发展及地理信息服务的不断深入,互联网上蕴含大量与空间位置密切相关的POI信息且大多位于深网网络之中,并在不断增多与变更,如何充分挖掘深网网络中蕴含的POI数据成为当前空间信息领域的一个研究热点。然而综合国内外相关研究可以发现,目前通用搜索引擎和普通深网爬行方法难以有效获取深网POI数据,其主要原因在于候选检索词库构建困难、爬行检索词需要优化、数据请求量受限制等,针对上述问题本文提出了一种基于检索词优化和空间自适应剖分的深网POI信息检索方法,并以北京市五环的外接矩形为实验区,对深网POI数据服务获取POI数据的方法进行了验证。本论文的主要研究工作包括以下两点:(1)针对深网POI数据获取过程中检索词库构建及优化困难,提出了利用基于爬行覆盖率排序的检索词优化方法,该方法通过整理网站分类目录、利用中文分词提取分类特征词以及同义词补充初步构建候选检索词,然后经过计算训练区深度探测结果,得到检索词检索效能指标,最后通过设置爬行覆盖... 

【文章来源】:中国测绘科学研究院北京市

【文章页数】:63 页

【学位级别】:硕士

【部分图文】:

检索词优化的深网POI数据自适应剖分获取方法研究


纯表单模式

链接模式


检索词优化的深网 POI 数据自适应剖分获取方法研究页处理则能够将该类型的数据进行全部展示。纯链接模式的数据在获取的过程中只需要通过采用浏览器控制+数据拦截方式来模拟用户操作行为,便可以对它的数据进行全量获取。不存在纯表单模式在数据获取过程中所存在的检索词构建困难等困难,但是由于其数据量有限,因此没有作为本文的研究重点。

地图,混合模式


图 2-3 纯链接模式(3)混合模式,是上述两种方式的混合方法,既提供预先设置的检索链接,也提供相应的查询接口让用户输入检索词,一般较大型的深网地图服务网站会采用混合模式,如高德地图、百度地图等。如腾讯地图所示,网站在总结不同用户所关注的主题内容的基础上,为酒店、餐饮、购物等提供了预先设置的检索链接,可以利用纯链接模式的获取方式对数据进行获取。在这个基础上,它还提供了利用检索条件对数据进行获取的方式即纯表单模式,可以将两种方式进行结合对 POI 数据进行获取。


本文编号:3341274

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/dizhicehuilunwen/3341274.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户a58e9***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com