当前位置:主页 > 医学论文 > 预防医学论文 >

基于中文分词的加权地理编码在COVID-19疫情防控空间定位中的应用

发布时间:2025-01-07 00:47
   地理编码是实现带有地址描述的信息空间定位的重要途径。比较研究了国内外地理编码方法,分析了中文地址的组成方式和定位方法。针对中文地址高度复杂性和多样性的特征,设计了一种顾及多种语义的地址匹配算法,并以武汉市新型冠状病毒肺炎(coronavirus disease 2019,COVID-19)病人入院时登记的地址描述信息为例,对匹配算法进行了实验验证,将匹配结果进行空间定位。结果表明,所提出的中文分词的加权地理编码方法匹配高效、定位准确、方法智能,能够实现基于语义的COVID-19病人入院时登记地址的快速定位,可为疫情防控提供准确的空间定位信息。

【文章页数】:8 页

【部分图文】:

图1 面‐点结构地址编码层次关系图

图1 面‐点结构地址编码层次关系图

中文地址一般可分为行政区地名、自然地名、街巷(道路、胡同)、道路门牌(门址)、住宅区、冠楼名等类型[12]。中文标准地址的形式由3部分组成,即〈标准地址〉::=〈行政辖区〉〈基本区域限定物〉〈局部点位置描述〉。其中,〈行政辖区〉为政区类地名;〈基本区域限定物〉可以是道路、小区等低....


图2 基于中文分词的加权地理编码方法

图2 基于中文分词的加权地理编码方法

文本分词是通过对中文文本词语进行自动识别来达到对文本自动分割的目的。由于地名地址的笼统性、复杂性与特殊性,难以遵循一些固有规律[8,11],因此,本文首先使用维特比算法计算初始状态的概率值,然后逐步计算各时刻的转移概率,再利用动态规划求解HMM模型,从而完成对文本的分词[17]。....


图3 基于链式法则的特征词选取

图3 基于链式法则的特征词选取

基于链式法则的特征词选择是根据不同词组在地址中的重要程度并借鉴链式求导法则原理提出的方法。根据链式求导法则可知,参数求导依赖于函数映射关系,函数可微性是函数是否可导的必要条件。借鉴该原理,将分词后结果分为中文和非中文两种特征词,其中中文特征词为主特征词,非中文特征词为次特征词。文....


图4 COVID‐19病例社区定位分布图

图4 COVID‐19病例社区定位分布图

为满足公共疫情防控需求,服务政府决策与评估,需要提供疫情在城市空间中的统计和分布情况,因此,在匹配完成后需要返回匹配地址的空间坐标,以满足城市疫情管控的定位需求。同时,以社区为单位,将匹配结果得到的COVID-19病例的定位坐标落到空间上,定位其所在社区的空间位置,并将定位结果按....



本文编号:4024242

资料下载
论文发表

本文链接:https://www.wllwen.com/yixuelunwen/yufangyixuelunwen/4024242.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户c1c89***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com