当前位置:主页 > 科技论文 > 软件论文 >

融合语言模型和注意力机制的蒙古文命名实体识别研究

发布时间:2021-02-12 01:00
  蒙古文命名实体识别是蒙古文自然语言处理的一项基础任务,其识别性能会直接影响后续处理任务或相关应用的性能。目前,基于深度学习的蒙古文命名实体识别研究工作相对较少,而采用传统机器学习方法在识别效果上仍不够理想。鉴于深度学习在其他语言命名实体识别中的优良表现和广泛应用,本文以双向长短时记忆网络-条件随机场模型(Bidirectional Long Short-term Memory-Conditional Random Fields,BLSTM-CRF)作为基线模型,同时结合蒙古文的构词特性,提出了融合语言模型和注意力机制的蒙古文命名实体识别方法。论文的主要工作如下:首先,本文提出了融合语言模型的蒙古文命名实体识别模型(Mongolian Named Entity Recognition-Language Model,MNER-LM)。针对蒙古文命名实体识别中标注语料稀缺的情况,本文通过训练语言模型捕获蒙古文文本中蕴含的语法和句法等语言学特征信息,并将这些特征信息引入BLSTM-CRF模型中来完成对模型仅从有限标注语料中学习到的信息进一步扩充。实验结果表明,MNER-LM模型的平均F值相比基... 

【文章来源】:内蒙古大学内蒙古自治区 211工程院校

【文章页数】:69 页

【学位级别】:硕士

【部分图文】:

融合语言模型和注意力机制的蒙古文命名实体识别研究


模型对训练语料规模的敏感性Figure3.6Sensitivityofthemodeltothenumberoftrainingcorpus

融合语言模型和注意力机制的蒙古文命名实体识别研究


不同网络结构的模型性能比较

【参考文献】:
期刊论文
[1]基于主题标签和CRF的中文微博命名实体识别[J]. 朱颢东,杨立志,丁温雪,冯嘉美.  华中师范大学学报(自然科学版). 2018(03)
[2]基于CRF算法的航天命名实体识别[J]. 徐建忠,朱俊,赵瑞,张亮,李娇娇.  电子设计工程. 2017(20)
[3]基于词典匹配的蒙古文命名实体识别研究[J]. 包敏娜,斯·劳格劳.  中央民族大学学报(哲学社会科学版). 2017(03)
[4]CRF和词典相结合的蒙古文地名识别研究[J]. 吴金星,丽丽,杨振新.  计算机工程与科学. 2016(05)
[5]基于HMM的京剧机构命名实体识别算法[J]. 乐娟,赵玺.  计算机工程. 2013(06)
[6]简约语法规则和最大熵模型相结合的混合实体识别[J]. 陆铭,康雨洁,俞能海.  小型微型计算机系统. 2012(03)
[7]基于层叠条件随机场的旅游领域命名实体识别[J]. 郭剑毅,薛征山,余正涛,张志坤,张宜浩,姚贤明.  中文信息学报. 2009(05)

博士论文
[1]蒙古文命名实体识别研究[D]. 王炜华.内蒙古大学 2018
[2]基于蒙古文语料库的人名自动识别[D]. 通拉嘎.中央民族大学 2013

硕士论文
[1]基于SVM和HMM算法的中文机构名称识别[D]. 祝继锋.吉林大学 2017
[2]基于CRF的蒙古文人名自动识别[D]. 才晶晶.内蒙古大学 2016
[3]基于规则和统计的西里尔与传统蒙古文相互转换方法研究[D]. 王洪伟.内蒙古大学 2015
[4]基于多模板HMM的中文命名实体识别[D]. 蓝雁玲.华南理工大学 2011



本文编号:3029994

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3029994.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户81ef5***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com