当前位置:主页 > 硕博论文 > 工程硕士论文 >

面向轨道交通规范的命名实体识别方法研究

发布时间:2021-02-02 20:42
  命名实体识别作为自然语言处理的一项重要子任务,是文本信息抽取的关键。目前针对开放域的中文命名实体识别工作已经取得了一定的进展,而针对不同垂直域的中文命名实体识别工作相对较少。设计规范作为建筑设计阶段的知识依据,在建筑工程设计环节中,起着决定性作用。本文面向轨道交通设计规范,首先定义该领域内五种命名实体类别,然后提出基于规则和统计的方法以及基于深度学习的方法,具体研究内容如下。(1)面向轨道交通设计规范的实体类别定义。作为命名实体识别的基础,本文首先对轨道交通设计规范中的实体类别进行定义。在具体实体类别定义过程中,以问题为导向,综合考虑后续知识图谱构建内容,结合轨道交通设计规范文本描述特点,同时参考其他垂直域命名实体类别定义,制定服务于知识图谱构建的实体类别定义。最后,将轨道交通设计规范实体类别定义为条目信息、属性值、规范名、抽象实体和专有实体共五类。(2)基于规则和统计的命名实体识别方法。本文首先对领域特定信息进行识别,然后基于现存知识库作为词典利用改进的双向最大匹配算法进行匹配,并设计算法进行消歧,得到初步结果。然后针对设计规范文本描述特点,制定边界修正规则和组合词更新规则,优化初步... 

【文章来源】:西安理工大学陕西省

【文章页数】:66 页

【学位级别】:硕士

【部分图文】:

面向轨道交通规范的命名实体识别方法研究


图3-1整体架构图??Fig.3-1?The?framework?of?method??

架构图,预处理,特定信息,数字


?西安理工大学领士学位论文???I? ̄??1??I?!?条目信息?!?「?1?1??1?I????j?j?j?I??I,??|?j?i?i?RMM?FMM?i??.|??|输入规范畤丨|麵值11叫?i?|岭I??;?!?r^]?\?\丨錄歧义词丨!?!??|?L?!?-—?‘?|??S?赞里言J!酵??J??图3-2规范预处理架构图??Fig.3-2?The?framework?of?preprocessing??3.?2.?1领域内特定信息抽取??轨道交通设计规范表现出其领域内独有的子语言特性。在阅读大量轨道交通??设计规范后,结合命名实体识别任务需求,定义了H种该领域内的特定信息。本??节首先定义三种特定信息的概念,再提出方法对规范中的特定信息进行识别。??(1)条目信息,是指规范的章节偵息。一般以“数字.数字.数字”的形式出现。??(2)属性值,是指确切表达一个目标或实体属性的质或量《?—般以“数字+单??位”的形式出现。??(3)规范名,是指_前规范引用的其他规范的全称。一般以“《规范名》+字??母数字集合”的形式出现。??如图3-3所示,图中展示了特定信息实例。???!?6.3.4正线坡)f大干24%。,连续高差达16m以上的长大陡坡地|??|段.应根掘线路f纵断I卿丨H候条件,核赍车辆的编飢及其牵|??|引和制动的动力性能,以及故障运行能力。长大坡段不宜与平|??!面小半径曲线重叠;同时应对道床排水沟断面进彳/校核。??「?Wtttt??1??1!??|?4.1.18列车在露天地面水平直线区段自由场内有砟道床无缝钢|??!轨轨道t以迎toa也

实例图,特定信息,实例,标题


?西安理工大学领士学位论文???I? ̄??1??I?!?条目信息?!?「?1?1??1?I????j?j?j?I??I,??|?j?i?i?RMM?FMM?i??.|??|输入规范畤丨|麵值11叫?i?|岭I??;?!?r^]?\?\丨錄歧义词丨!?!??|?L?!?-—?‘?|??S?赞里言J!酵??J??图3-2规范预处理架构图??Fig.3-2?The?framework?of?preprocessing??3.?2.?1领域内特定信息抽取??轨道交通设计规范表现出其领域内独有的子语言特性。在阅读大量轨道交通??设计规范后,结合命名实体识别任务需求,定义了H种该领域内的特定信息。本??节首先定义三种特定信息的概念,再提出方法对规范中的特定信息进行识别。??(1)条目信息,是指规范的章节偵息。一般以“数字.数字.数字”的形式出现。??(2)属性值,是指确切表达一个目标或实体属性的质或量《?—般以“数字+单??位”的形式出现。??(3)规范名,是指_前规范引用的其他规范的全称。一般以“《规范名》+字??母数字集合”的形式出现。??如图3-3所示,图中展示了特定信息实例。???!?6.3.4正线坡)f大干24%。,连续高差达16m以上的长大陡坡地|??|段.应根掘线路f纵断I卿丨H候条件,核赍车辆的编飢及其牵|??|引和制动的动力性能,以及故障运行能力。长大坡段不宜与平|??!面小半径曲线重叠;同时应对道床排水沟断面进彳/校核。??「?Wtttt??1??1!??|?4.1.18列车在露天地面水平直线区段自由场内有砟道床无缝钢|??!轨轨道t以迎toa也

【参考文献】:
期刊论文
[1]面向军事文本的命名实体识别[J]. 冯蕴天,张宏军,郝文宁.  计算机科学. 2015(07)
[2]基于规则的越南语命名实体识别研究[J]. 闫丹辉,毕玉德.  中文信息学报. 2014(05)
[3]基于规则设定的全方位碰撞检查技术[J]. 曾旭东,王诗旭.  建筑与文化. 2014(08)
[4]基于Solibri Model Checker的BIM模型质量检查方法探究[J]. 吉久茂,童华炜,张家立.  土木建筑工程信息技术. 2014(01)
[5]面向短文本的命名实体识别[J]. 王丹,樊兴华.  计算机应用. 2009(01)
[6]中文金融新闻中公司名的识别[J]. 王宁,葛瑞芳,苑春法,黄锦辉,李文捷.  中文信息学报. 2002(02)
[7]面向对象的地基与基础规范知识库设计[J]. 晏致涛,李正良,邓安福.  重庆大学学报(自然科学版). 2002(02)

硕士论文
[1]面向中文医疗文本的命名实体识别研究[D]. 徐国海.华东师范大学 2019
[2]基于IFC和本体的建筑施工图合规性审查研究[D]. 甘晨.华中科技大学 2018



本文编号:3015340

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/boshibiyelunwen/3015340.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户c9241***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com