当前位置:主页 > 科技论文 > 测绘论文 >

规则匹配和深度学习结合的文本空间信息识别及定位

发布时间:2021-07-27 07:36
  充分识别并空间化文本中蕴含的空间位置信息,对文本数据挖掘研究具有重要意义。由于文本中的空间信息存在描述不规范、形式多样和混杂方言等特点,识别难度大,提出一种规则匹配和深度学习相结合的空间信息识别及定位方法。首先根据标准地名地址制作匹配语义库,利用规则匹配法精准提取空间信息并实现空间定位;然后将其作为深度学习的样本数据,训练BERT-BiLSTM-CRF模型,实现空间信息的自动提取;再利用前后缀特征词匹配规则作为补充处理,进一步充分提取文本中的空间信息;最后利用地理编码技术实现空间定位。实验表明,本方法能有效提高空间信息识别的准确率、召回率,具有可操作性。 

【文章来源】:地理信息世界. 2020,27(05)

【文章页数】:8 页

【部分图文】:

规则匹配和深度学习结合的文本空间信息识别及定位


互联网文本中空间信息提取及定位技术流程

地名,地址,语义


为构建强有力的规则,收集了4个知识库,以标准地名地址库为基础,扩充接入互联网地名地址库、地名地址变形库,地名地址前后缀特征库,形成地名地址语义库,如图2所示。1)标准地名地址库

后缀,地名,前缀,文本


文本中描述的中文地名地址,常出现在前缀词与后缀词之间,因此将前缀词作为起始语,后缀词作为结束语,可粗提取文本中的地名地址,如图3所示。2.2 基于规则匹配的地名信息提取

【参考文献】:
期刊论文
[1]基于注意力机制的命名实体识别模型研究——以军事文本为例[J]. 单义栋,王衡军,黄河,闫倩.  计算机科学. 2019(S1)
[2]基于迁移学习和BiLSTM-CRF的中文命名实体识别[J]. 武惠,吕立,于碧辉.  小型微型计算机系统. 2019(06)
[3]面向微博的灾害类事件地址提取与空间定位方法——以地震事件为例[J]. 李想,刘纪平,罗安,王勇.  测绘与空间地理信息. 2018(04)
[4]一种基于复合特征的中文地名识别方法[J]. 魏勇,李鸿飞,胡丹露,李响,马雷雷.  武汉大学学报(信息科学版). 2018(01)
[5]基于BLSTM的命名实体识别方法[J]. 冯艳红,于红,孙庚,孙娟娟.  计算机科学. 2018(02)
[6]智慧重庆地理编码服务平台建设与应用[J]. 李林,梁星,刘骏,梁均军.  地理信息世界. 2017(01)
[7]基于条件随机场的中文地名识别方法[J]. 邬伦,刘磊,李浩然,高勇.  武汉大学学报(信息科学版). 2017(02)
[8]基于深度学习的中文机构名识别研究——一种汉字级别的循环神经网络方法[J]. 朱丹浩,杨蕾,王东波.  现代图书情报技术. 2016(12)
[9]前后缀与特征词相结合的地名地址提取[J]. 王克永,刘纪平,罗安,王勇.  测绘通报. 2016(02)
[10]网络文本蕴涵地理信息抽取:研究进展与展望[J]. 余丽,陆锋,张恒才.  地球信息科学学报. 2015(02)



本文编号:3305372

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/dizhicehuilunwen/3305372.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户febb3***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com