基于GRU-CRF的中文命名实体识别方法研究
发布时间:2021-03-07 05:22
中文命名实体识别作为中文自然语言处理领域中的基本任务之一,是中文自然语言处理综合应用中机器翻译、信息抽取等任务的基础环节,直接影响自然语言处理后续工作的性能。随着网络文本资源的增长,从网络中高效地发现和获取新知识,通过文本更方便地进行知识挖掘和分析,中文命名实体识别发挥着重大作用。研究实现基于深度学习的中文命名实体特征提取算法来更好地识别中文命名实体的实体特征,提高系统对中文命名实体特征的识别能力,是基于深度学习的命名实体识别问题研究的重要内容。论文以基于深度学习的命名实体识别为主要研究内容。首先,对国内外命名实体识别的解决方法进行了研究,而后,针对近几年基于深度学习的相关神经网络解决命名实体识别的方法进行分析,深入研究了基于循环神经网络、长短时记忆神经网络、门控循环单元网络等模型的中文命名实体特征提取算法。最终提出了解决中文命名实体识别问题的新方案。针对中文命名实体识别提出一种门控循环单元网络(GRU)和条件随机场(CRF)相结合的神经网络模型。对该模型在中文命名实体识别任务的应用进行深入研究,优化了模型训练过程对于中文命名实体特征提取的效果,解决了实验中中文标注语料匮乏的问题,使其...
【文章来源】:哈尔滨理工大学黑龙江省
【文章页数】:53 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第1章 绪论
1.1 课题背景及研究的目的和意义
1.2 国内外研究现状
1.3 论文研究的主要内容
第2章 神经网络与条件随机场
2.1 神经网络理论
2.2 循环神经网络
2.2.1 基本循环神经网络
2.2.2 双向循环神经网络
2.3 长短时记忆神经网络
2.3.1 LSTM网络
2.3.2 双向长短时记忆神经网络
2.4 门控循环单元
2.4.1 GRU结构分析
2.4.2 双向GRU结构分析
2.5 条件随机场
2.6 其他神经网络整体模型
2.6.1 RNN-CRF网络模型
2.6.2 LSTM-CRF网络模型
2.7 本章小结
第3章 中文命名实体识别模型设计
3.1 GRU-CRF整体网络模型
3.2 网络模型原理
3.3 模型结构流程
3.3.1 整体网络模型的训练过程
3.3.2 整体网络模型的识别
3.4 本章小结
第4章 实验与分析
4.1 环境配置和语料预处理
4.1.1 Tensorflow深度学习框架
4.1.2 中文语料预处理
4.2 语料标注集和评估指标
4.2.1 语料标注集
4.2.2 评估指标
4.3 实验结果分析
4.4 本章小结
结论
参考文献
攻读硕士学位期间发表的学术论文及获得成果
致谢
【参考文献】:
期刊论文
[1]基于语义理解注意力神经网络的多元特征融合中文文本分类[J]. 谢金宝,侯永进,康守强,李佰蔚,张霄. 电子与信息学报. 2018(05)
[2]基于深度神经网络的中文命名实体识别[J]. 张海楠,伍大勇,刘悦,程学旗. 中文信息学报. 2017(04)
[3]基于BLSTM的命名实体识别方法[J]. 冯艳红,于红,孙庚,孙娟娟. 计算机科学. 2018(02)
[4]大数据背景下数据新闻的文本挖掘算法的研究[J]. 程铃钫,黄泽文. 科技广场. 2017(04)
[5]基于深度学习的算法知识实体识别与发现[J]. 朱国进,沈盼宇. 智能计算机与应用. 2017(01)
[6]基于递归神经网络的文本分类研究[J]. 黄磊,杜昌顺. 北京化工大学学报(自然科学版). 2017(01)
[7]深度学习研究与进展[J]. 孙志远,鲁成祥,史忠植,马刚. 计算机科学. 2016(02)
[8]中英命名实体识别及对齐中的中文分词优化[J]. 尹存燕,黄书剑,戴新宇,陈家骏. 电子学报. 2015(08)
[9]面向军事文本的命名实体识别[J]. 冯蕴天,张宏军,郝文宁. 计算机科学. 2015(07)
[10]基于CRF和规则相结合的地理命名实体识别方法[J]. 何炎祥,罗楚威,胡彬尧. 计算机应用与软件. 2015(01)
本文编号:3068473
【文章来源】:哈尔滨理工大学黑龙江省
【文章页数】:53 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第1章 绪论
1.1 课题背景及研究的目的和意义
1.2 国内外研究现状
1.3 论文研究的主要内容
第2章 神经网络与条件随机场
2.1 神经网络理论
2.2 循环神经网络
2.2.1 基本循环神经网络
2.2.2 双向循环神经网络
2.3 长短时记忆神经网络
2.3.1 LSTM网络
2.3.2 双向长短时记忆神经网络
2.4 门控循环单元
2.4.1 GRU结构分析
2.4.2 双向GRU结构分析
2.5 条件随机场
2.6 其他神经网络整体模型
2.6.1 RNN-CRF网络模型
2.6.2 LSTM-CRF网络模型
2.7 本章小结
第3章 中文命名实体识别模型设计
3.1 GRU-CRF整体网络模型
3.2 网络模型原理
3.3 模型结构流程
3.3.1 整体网络模型的训练过程
3.3.2 整体网络模型的识别
3.4 本章小结
第4章 实验与分析
4.1 环境配置和语料预处理
4.1.1 Tensorflow深度学习框架
4.1.2 中文语料预处理
4.2 语料标注集和评估指标
4.2.1 语料标注集
4.2.2 评估指标
4.3 实验结果分析
4.4 本章小结
结论
参考文献
攻读硕士学位期间发表的学术论文及获得成果
致谢
【参考文献】:
期刊论文
[1]基于语义理解注意力神经网络的多元特征融合中文文本分类[J]. 谢金宝,侯永进,康守强,李佰蔚,张霄. 电子与信息学报. 2018(05)
[2]基于深度神经网络的中文命名实体识别[J]. 张海楠,伍大勇,刘悦,程学旗. 中文信息学报. 2017(04)
[3]基于BLSTM的命名实体识别方法[J]. 冯艳红,于红,孙庚,孙娟娟. 计算机科学. 2018(02)
[4]大数据背景下数据新闻的文本挖掘算法的研究[J]. 程铃钫,黄泽文. 科技广场. 2017(04)
[5]基于深度学习的算法知识实体识别与发现[J]. 朱国进,沈盼宇. 智能计算机与应用. 2017(01)
[6]基于递归神经网络的文本分类研究[J]. 黄磊,杜昌顺. 北京化工大学学报(自然科学版). 2017(01)
[7]深度学习研究与进展[J]. 孙志远,鲁成祥,史忠植,马刚. 计算机科学. 2016(02)
[8]中英命名实体识别及对齐中的中文分词优化[J]. 尹存燕,黄书剑,戴新宇,陈家骏. 电子学报. 2015(08)
[9]面向军事文本的命名实体识别[J]. 冯蕴天,张宏军,郝文宁. 计算机科学. 2015(07)
[10]基于CRF和规则相结合的地理命名实体识别方法[J]. 何炎祥,罗楚威,胡彬尧. 计算机应用与软件. 2015(01)
本文编号:3068473
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3068473.html
最近更新
教材专著