检索词优化与空间自适应的深网POI获取方法研究
发布时间:2022-08-07 21:05
针对检索词库构建困难、数据请求量受限制等相关问题,该文提出一种基于独立覆盖率排序和空间自适应剖分的深网POI信息搜索方法,通过候选检索词初步构建、贪婪式探测搜索、检索词优化降维、空间自适应剖分爬行等主要流程,利用逐步逼近POI搜索的最大覆盖最优解,实现对深网POI信息的全量获取,大幅度提高深网POI数据的召回率与采集效率,该方法对于丰富地理信息资源、提升空间信息服务与内容管理能力具有重要意义。
【文章页数】:6 页
【文章目录】:
0 引言
1 深网POI获取
1.1 潜在检索词生成
1.2 贪婪式探测查询
1.3 基于重复覆盖迭代计算的检索词序列生成
1.4 空间范围自适应剖分的空间爬行
2 实验结果与分析
2.1 优化检索词生成
2.2 爬行效能
3 结束语
【参考文献】:
期刊论文
[1]地表覆盖网络化信息发现方法研究[J]. 侯东阳. 测绘学报. 2017(01)
[2]基于深层网络爬虫的Web地图服务发现方法[J]. 侯东阳,武昊,王军锋,王明山. 地理与地理信息科学. 2015(05)
[3]POI的分类标准研究[J]. 张玲. 测绘通报. 2012(10)
[4]基于层次树模型的Deep Web数据提取方法[J]. 田建伟,李石君. 计算机研究与发展. 2011(01)
[5]Deep Web数据集成研究综述[J]. 刘伟,孟小峰,孟卫一. 计算机学报. 2007(09)
[6]Deep Web爬虫研究与设计[J]. 郑冬冬,赵朋朋,崔志明. 清华大学学报(自然科学版). 2005(S1)
博士论文
[1]深网数据集成与挖掘关键问题的建模及算法研究[D]. 李雁妮.西安电子科技大学 2013
本文编号:3671042
【文章页数】:6 页
【文章目录】:
0 引言
1 深网POI获取
1.1 潜在检索词生成
1.2 贪婪式探测查询
1.3 基于重复覆盖迭代计算的检索词序列生成
1.4 空间范围自适应剖分的空间爬行
2 实验结果与分析
2.1 优化检索词生成
2.2 爬行效能
3 结束语
【参考文献】:
期刊论文
[1]地表覆盖网络化信息发现方法研究[J]. 侯东阳. 测绘学报. 2017(01)
[2]基于深层网络爬虫的Web地图服务发现方法[J]. 侯东阳,武昊,王军锋,王明山. 地理与地理信息科学. 2015(05)
[3]POI的分类标准研究[J]. 张玲. 测绘通报. 2012(10)
[4]基于层次树模型的Deep Web数据提取方法[J]. 田建伟,李石君. 计算机研究与发展. 2011(01)
[5]Deep Web数据集成研究综述[J]. 刘伟,孟小峰,孟卫一. 计算机学报. 2007(09)
[6]Deep Web爬虫研究与设计[J]. 郑冬冬,赵朋朋,崔志明. 清华大学学报(自然科学版). 2005(S1)
博士论文
[1]深网数据集成与挖掘关键问题的建模及算法研究[D]. 李雁妮.西安电子科技大学 2013
本文编号:3671042
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/3671042.html