当前位置:主页 > 科技论文 > 测绘论文 >

基于NewMap Server地名地址检索服务的设计与实现

发布时间:2020-08-04 17:18
【摘要】:城市发展的模式经历了农业城镇、工业城市、数字城市,最后逐步走向智慧城市,智慧城市已经成为城市发展的必然方向。地名地址是空间数据信息和非空间数据信息关联的重要途径,在智慧城市建设过程中,地名地址服务是其基本的服务内容之一。地名地址检索技术是将GIS融入到其他相关领域的关键技术之一,如何实现地名地址快速准确的检索是地名地址服务应用的关键问题。地名地址分词是地名地址检索服务的前提和必要步骤。地名地址分词是指根据一定的中文分词算法将地名地址字符串切分成一个个单独的词的过程。本文在对地名地址的检索服务设计和实现的研究过程中,主要做了以下的工作:(1)通过分析比较不同中文分词算法的优缺点,采用并改进简单高效的MMSEG中文分词算法用于地名地址分词。在分词过程中利用Complex字符匹配算法,采用词块的长度最大、词块的平均词长最大、词块的词长变化最小、词块中单字的出现词自由度最高等四种规则来尽可能的消除分词过程中的分词歧义,提高分词的准确度。在构建字典方面,在词典中加入与地名地址相关的一些词语来进一步提高分词的准确度。(2)采用Lucene全文检索引擎对地名地址建立索引和检索。通过对Lucene全文检索引擎的中文分词接口的研究与分析,将MMSEG中文分词算法集成到Lucene中,并用于对地名地址的分词。利用改进的Lucene对地名地址数据建立索引,并对索引进行检索。将用户的检索历史记录信息参与到索引的更新,使得检索的结果更加符合用户需求。在建立索引和检索时,对建立索引过程中的参数进行优化,提高了索引的速度;在检索过程中,采用多域检索,使得结果更加准确。(3)基于NewMap Server框架,开发了地名地址的GeoCodeServer服务模块,GeoCodeServer服务模块的三个接口分别为:capabilities接口、geocode接口、reverse接口。利用GeoCodeServer服务模块将地名地址的检索发布成服务,方便其他编辑人员在此基础上进行开发和使用。通过实验验证,该检索服务具有较高的检索效率和检索精度。
【学位授予单位】:山东科技大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:P281;P208
【图文】:

软件界面,服务器,软件


:jjOSSEiMI邋Btei^lMiaj逡逑@33SEI38i逡逑图2.1服务器整体架构逡逑Fig.邋2.1邋Sener邋overall邋architecture逡逑?邋0r邋C.邋I37A0.1邋■邋?逦分邋>逡逑?iiw逦???0/-?—We,邋M逦逦逡逑Kni\H^|i逦变(9??从??邋字ft?v婜逡逑' ̄ ̄ ̄——邋逦iM*n0邋tM>邋rm?*?gn邋00??#■■'>?邋?*'■"逡逑|ctt软件逡逑?邋NewMap邋Server逦?邋NewMap邋App逡逑RtrrM邋VMkS?TM(??邋OOC邋Mr??twvMM逦?*??*??(>Uanagw逦ftowtU?Vtaw??逦NawtUpfiMM逡逑逦逦逦:.逦邋.??.邋—邋.邋^邋..,.邋逦逦邋.逡逑图2.2邋NewMap软件界面逡逑Fig.邋2.2邋NewMap邋software邋interface逡逑7逡逑

设计框架,功能,插件


逡逑(5)与云环境无缝集成,支持物联网接口。逡逑(6)支持面向服务的构件组装与功能扩展技术。逡逑2.1.2邋NewMap邋Server邋功能分析逡逑NewMap邋Server邋软件是基于邋Browser、Web邋Server、GIS邋Server邋以及邋Data逡逑Server的四层分布式架构,其中GIS邋Server层是采用结合插件技术的多进程和逡逑多线程模式的混合模型,使用插件技术封装GIS功能使得功能和服务器分离,逡逑通过调度和分配多个SOC进程和线程响应服务的并发请求%]。逡逑NewMap邋Server在响应来自Web请求时创建并加载功能服务插件,具体过逡逑程是:服务端接收到Web服务请求后,根据请求的Service名称调用相对应的逡逑功能插件,插件成功调用后,根据Request名称执行插件模块内的功能方法,逡逑NewMap邋Server的功能插件设计框架如图2.3所示,各功能插件都继承于基类逡逑CbaseServicePlug,在实例化功能模块时,创建插件成功调用后返回虚基类指针。逡逑逦逦逦逦逦

框架图,字典,框架,中文分词


表2.1基于字符串的不同中文分词算法的比较逡逑b.2.1邋Comparison邋of邋different邋string-based邋segmentation邋algorPaoding邋MMSEG逦ICTCLAS逦SCWSJava邋C/C++、Java邋等邋C/C++、Java邋等邋C/C++UTF-8邋GBK、UTF-8邋GBK>邋UTF-8邋GBK、UTF-896.1%逦98.4%逦98.4%逦90%邋 ̄邋95%通用逦通用逦通用逦小型搜索引擎是是逦是是是是逦未知逦未知jar包逦Lucene、solr逦多语言接口逦PHP库计的中文分词算法的理论基础是概率论,原理是根据率判断其是否成词统计分词法的局限性在于对且时空开销大。张梅山等[45]人将词典运用到了统计相结合的分词流程,起到了很好的分词效果。逡逑

【参考文献】

相关期刊论文 前10条

1 韩冬煦;常宝宝;;中文分词模型的领域适应性方法[J];计算机学报;2015年02期

2 李胜东;吕学强;孙军;施水才;;Lucene全文索引效率的改进[J];山东大学学报(理学版);2015年07期

3 邹崇尧;朱贵方;赵双明;;基于搜索引擎技术的地名地址定制查询研究[J];测绘通报;2014年08期

4 杜鸿舰;金晓燕;梁新昀;敖琳;;中文分词系统的设计与实现[J];电脑开发与应用;2014年08期

5 张芬;;基于音头输入的地名地址快速定位方法研究[J];城市勘测;2014年01期

6 来斯惟;徐立恒;陈玉博;刘康;赵军;;基于表示学习的中文分词算法探索[J];中文信息学报;2013年05期

7 魏扣;;全文检索技术在我国新型公共档案馆建设中的应用[J];北京档案;2013年04期

8 马斌;;中国当代城市发展中的城市问题研究[J];产业与科技论坛;2013年06期

9 李成名;刘晓丽;印洁;毛曦;;数字城市到智慧城市的思考与探索[J];测绘通报;2013年03期

10 李德仁;姚远;邵振峰;;智慧城市的概念、支撑技术及应用[J];工程研究-跨学科视野中的工程;2012年04期

相关博士学位论文 前1条

1 吕欢欢;基于地理信息公共服务平台的语义地名地址匹配方法研究[D];辽宁工程技术大学;2014年

相关硕士学位论文 前10条

1 宋婷婷;基于NewMap Server架构的在线专题制图技术研究与试验[D];中国测绘科学研究院;2017年

2 朱立宁;基于NewMap Server的公交出行服务的设计与实现[D];山东农业大学;2015年

3 吴悠;地理信息公共服务平台地名信息检索方法研究[D];南京师范大学;2013年

4 赵立磊;基于网页去重的垂直搜索引擎设计与实现[D];大连理工大学;2012年

5 李斌;基于Lucene的分布式全文检索在构件库系统中的实现[D];西安电子科技大学;2012年

6 唐静;城市地名地址的编码匹配研究[D];昆明理工大学;2011年

7 尉建兴;基于Lucene搜索引擎的研究与应用[D];太原理工大学;2011年

8 郑希亮;基于语义理解的税务稽查辅助系统[D];西安电子科技大学;2011年

9 付敏;一个改进的中文分词算法及其在Lucene中的应用[D];华中科技大学;2010年

10 张淑梅;词典与后缀数组相结合的中文分词[D];吉林大学;2006年



本文编号:2780847

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/dizhicehuilunwen/2780847.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户54f68***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com