当前位置:主页 > 科技论文 > 自动化论文 >

深度神经网络下的规范化地址建设与语义空间模型研究

发布时间:2021-05-12 08:53
  随着GIS认知与应用能力的不断提升,地址信息逐步成为智慧城市时代的核心资源,其内容中所承载的语义和空间内涵,更是构建智慧城市中地理本体与时空语义框架的基础支撑。因此,全方位开展地名地址规范化建设与社会化应用研究已成为当前的学术界热点。让计算机从理解地址文本的角度出发,深度提炼地名地址综合特征并形成数值形式的量化表达,使其具有人类认知水平的处理能力,是从根本上实现上述任务的关键前提,对于融合和理解城市语义与空间内容具有重要的理论价值和实践意义。然而当前以非结构化文本管理或地址编码为核心的理论研究,由于无法深入挖掘文本的特征内涵,导致其在任务处理时面临信息孤岛、附加数据依赖、泛化性弱等突出问题,极大限制了地址数据在智慧城市领域内的使用。针对现有地名地址研究中存在的信息特征表达不充分、数据建设工作不深入、应用场景局限的困境,本文综合利用现代人工智能方法的深度神经网络架构,将文本特征提取、地址规范化建设和语义空间融合等任务转化为可量化的深度神经网络模型构建与训练优化问题。以地址中的字符为基本输入单元,设计语言模型将其向量化表达。在此基础上,将地名地址规范化建设的关键技术通过神经网络目标任务加以... 

【文章来源】:浙江大学浙江省 211工程院校 985工程院校 教育部直属院校

【文章页数】:170 页

【学位级别】:博士

【文章目录】:
致谢
摘要
Abstract
术语缩写表
1 绪论
    1.1 研究背景与意义
    1.2 国内外现状
        1.2.1 地址规范化建设方法研究
        1.2.2 自然语言建模方法研究
        1.2.3 存在问题与不足
    1.3 研究目的
    1.4 研究内容
    1.5 论文组织与章节安排
2 地名地址语义特征表达研究
    2.1 深度神经网络下的语义表达方法
        2.1.1 深度神经网络方法理论
        2.1.2 自然语言自注意力机制理论
        2.1.3 神经网络语言模型结构
    2.2 地名地址语言模型设计
        2.2.1 基于多头自注意力的语义特征提取
        2.2.2 位置顺序加权的字符向量化表达
        2.2.3 未知字符预测的目标任务
        2.2.4 整体模型结构
    2.3 地名地址语言模型训练框架
        2.3.1 随机屏蔽策略的自然语言训练方案
        2.3.2 模型输入与超参数构造
        2.3.3 目标函数与损失函数
        2.3.4 神经网络优化器设计
        2.3.5 模型语义输出
    2.4 实验设计与模型验证
        2.4.1 实验设计
        2.4.2 实验结果分析
    2.5 本章小结
3 地址文本的规范化建设研究
    3.1 复合神经网络的地址分词语言模型
        3.1.1 相关神经网络介绍
        3.1.2 复合神经网络结构设计
    3.2 无监督分词训练框架
        3.2.1 最大化地址文本生成概率的训练方案
        3.2.2 目标函数与损失函数
        3.2.3 模型输入与超参数构造
        3.2.4 分词结果输出
    3.3 微监督分词优化策略
    3.4 地理实体标注与文本标准化
        3.4.1 自学习的复合词性标注方法
        3.4.2 TRIE树规范下的地址标准化
    3.5 实验设计与模型验证
        3.5.1 实验设计
        3.5.2 实验结果分析
    3.6 本章小结
4 地名地址语义-空间特征融合研究
    4.1 地址语义-空间加权聚类方法
        4.1.1 地址文本语义向量表达
        4.1.2 K-Means聚类理论
        4.1.3 高维特征融合聚类方法
    4.2 地址语义-空间融合建模
        4.2.1 深度神经网络模型微调理论
        4.2.2 语义-空间加权建模与训练
    4.3 空间坐标预测的下游验证任务
    4.4 实验设计与分析
        4.4.1 实验设计
        4.4.2 实验结果分析
    4.5 本章小结
5 总结与展望
    5.1 研究总结
    5.2 研究特色与创新
    5.3 研究展望
参考文献
作者简历


【参考文献】:
期刊论文
[1]Research of Clinical Named Entity Recognition Based on Bi-LSTM-CRF[J]. 秦颖,曾颖菲.  Journal of Shanghai Jiaotong University(Science). 2018(03)
[2]基于复合字典的地名地址匹配技术[J]. 程琦,梁武卫,汪培.  城市勘测. 2018(01)
[3]基于双向LSTM神经网络模型的中文分词[J]. 金宸,李维华,姬晨,金绪泽,郭延哺.  中文信息学报. 2018(02)
[4]一种基于复合特征的中文地名识别方法[J]. 魏勇,李鸿飞,胡丹露,李响,马雷雷.  武汉大学学报(信息科学版). 2018(01)
[5]基于LSTM网络的中文地址分词法的设计与实现[J]. 张文豪,卢山,程光.  计算机应用研究. 2018(12)
[6]基于BI-LSTM-CRF模型的中文分词法[J]. 张子睿,刘云清.  长春理工大学学报(自然科学版). 2017(04)
[7]基于半监督CRF的跨领域中文分词[J]. 邓丽萍,罗智勇.  中文信息学报. 2017(04)
[8]基于BLSTM的命名实体识别方法[J]. 冯艳红,于红,孙庚,孙娟娟.  计算机科学. 2018(02)
[9]基于门循环单元神经网络的中文分词法[J]. 李雪莲,段鸿,许牧.  厦门大学学报(自然科学版). 2017(02)
[10]大数据驱动的地名信息获取与应用[J]. 张雪英,闾国年,杜咪,叶鹏.  现代测绘. 2017(02)

博士论文
[1]基于地理信息公共服务平台的语义地名地址匹配方法研究[D]. 吕欢欢.辽宁工程技术大学 2014

硕士论文
[1]基于GRU神经网络结合CRF的中文分词研究分析[D]. 慕容伟波.华南理工大学 2018
[2]基于空间场景相似性的投诉地址推荐[D]. 万海翔.武汉大学 2017
[3]基于统计学方法的地址标准化模型的建立[D]. 简荣杰.云南大学 2015
[4]基于条件随机场和空间推理的地理编码方法[D]. 周海.解放军信息工程大学 2015
[5]基于规则的中文地址分词与匹配方法[D]. 谭侃侃.山东科技大学 2011
[6]基于CRF的中文地名识别研究[D]. 廖文平.大连理工大学 2010



本文编号:3183126

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3183126.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户07602***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com