当前位置:主页 > 管理论文 > 管理理论论文 >

基于BI-LSTM-CRF的作战文书命名实体识别

发布时间:2021-03-18 16:22
  为解决部分军事命名实体导致规则、统计等传统模型识别率不高的问题,提出一种基于双向长短期记忆—条件随机场(BI-LSTM-CRF)的作战文书命名实体识别方法。介绍作战文书命名实体识别的概念、特点,给出模型具体训练方法与步骤,在手工构建的数据集上进行开放性测试。结果表明,该方法能有效提升作战文书命名实体的识别准确率,模型最终的识别精确率和召回率分别达到91.40%和90.43%。 

【文章来源】:信息工程大学学报. 2019,20(04)

【文章页数】:6 页

【部分图文】:

基于BI-LSTM-CRF的作战文书命名实体识别


BI-LSTM-CRF模型基本结构

模型图,步骤,模型,文书


基于BI-LSTM-CRF的作战文书命名实体识别方法的基本思路:输入一个句子,使用双向LSTM模型的隐层作为输入,经过一个CRF层,得到可表示命名实体的标注序列。该方法有效结合了CRF和LSTM的优点,且双向的网络结构能更有效地获取目标词的上下文信息,从而提高作战文书命名实体的识别效果。基于BI-LSTM-CRF的作战文书命名实体识别步骤如图2所示。3.2 预处理及训练集标注

尺寸,维度,向量,数据集


一般认为,词向量的维度越大,包含词的信息就越多。分别采取50维、100维、200维、300维、400维5个不同维度的词向量进行了测试。结果表明,当维度到达200维后,对训练的收敛速度影响变小,且对最终得分影响不大(如图5所示)。因此,该方法依赖于数据集的规模,在一定量的数据集下,词向量维度到达一定维数后,对性能提升的作用较小,会大量增加内存的消耗。图4 不同优化器的表现

【参考文献】:
期刊论文
[1]基于神经网络的片段级中文命名实体识别[J]. 王蕾,谢云,周俊生,顾彦慧,曲维光.  中文信息学报. 2018(03)
[2]基于CNN-BLSTM-CRF模型的生物医学命名实体识别[J]. 李丽双,郭元凯.  中文信息学报. 2018(01)
[3]基于深度神经网络的武器名称识别[J]. 游飞,张激,邱定,于铭华.  计算机系统应用. 2018(01)
[4]小粒度策略下基于CRFs的军事命名实体识别方法[J]. 单赫源,张海粟,吴照林.  装甲兵工程学院学报. 2017(01)
[5]面向军事文本的命名实体识别[J]. 冯蕴天,张宏军,郝文宁.  计算机科学. 2015(07)
[6]基于CRF和规则相结合的地理命名实体识别方法[J]. 何炎祥,罗楚威,胡彬尧.  计算机应用与软件. 2015(01)
[7]双层CRF与规则相结合的中文地名识别方法研究[J]. 孙虹,陈俊杰.  计算机应用与软件. 2014(11)
[8]CRF与规则相结合的军事命名实体识别研究[J]. 姜文志,顾佼佼,丛林虎.  指挥控制与仿真. 2011(04)
[9]作战文书关键信息抽取方法[J]. 李畅,王永良,冯晓洁,聂峰.  兵工自动化. 2011(05)
[10]CRF与规则相结合的地理空间命名实体识别[J]. 鞠久朋,张伟伟,宁建军,周国栋.  计算机工程. 2011(07)



本文编号:3088599

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/glzh/3088599.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户83168***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com