当前位置:主页 > 科技论文 > 软件论文 >

基于深度学习的中文特定领域命名实体识别方法研究

发布时间:2023-05-07 18:23
  互联网信息化社会的高速发展,带给了我们越来越多的便利,随之也产生了海量文本信息,如何对这些非结构化的信息进行分析挖掘,将自然语言解析为计算机可处理、可理解的语言形式以实现知识的获取和表示,是自然语言处理(Natural Language Processing,NLP)研究的一个核心目标,同时也是人工智能的主题之一,对于实现机器认知智能具有重要意义。命名实体识别(Named Entity Recognition,NER)作为自然语言处理研究的重要组成,要求对各式各样文本数据中具有特定含义的诸如人物名、地名、组织机构名等实体语言成分进行识别,是对话交互系统(Dialogue and Interactive Systems)、自动问答(Automatic Question and Answering)等高层自然语言处理技术中必不可少的一部分。以往的研究主要关注于上述几种常见类型的实体,相对已经成熟,而在特定领域,尤其是针对中文特定领域的实体识别仍处于发展阶段,相关研究较少。由于标注语料稀少、专有术语和稀有词较多,中文特定领域的文本更难以建模和表示,极具挑战性,因而本文的研究重点将集中于此。对...

【文章页数】:81 页

【学位级别】:硕士

【文章目录】:
摘要
英文摘要
1 绪论
    1.1 课题研究背景和意义
    1.2 国内外相关研究现状
        1.2.1 传统基于规则的命名实体识别方法
        1.2.2 基于统计机器学习的命名实体识别方法
        1.2.3 基于深度学习的命名实体识别方法
    1.3 论文主要工作内容及章节安排
2 相关理论与技术基础
    2.1 自然语言的数值化
        2.1.1 独热编码表示
        2.1.2 分布式编码表示
    2.2 基于统计机器学习的模型
        2.2.1 条件随机场
        2.2.2 维特比算法
    2.3 深度学习相关理论与模型
        2.3.1 激活函数
        2.3.2 循环神经网络
        2.3.3 长短期记忆网络
        2.3.4 注意力机制模型Transformer
        2.3.5 正则化方法Dropout
    2.4 本章小结
3 基于循环神经网络的实体识别方法
    3.1 基于BiLSTM-CRF模型的实体识别方法
        3.1.1 BiLSTM模型
        3.1.2 BiLSTM-CRF模型
    3.2 基于Hierarchical BiLSTM-CRF模型的实体识别方法
    3.3 实验语料及其预处理
        3.3.1 数据集介绍
        3.3.2 数据预处理及其统计
    3.4 相关实验
        3.4.1 实验评价指标
        3.4.2 基于BiLSTM-CRF模型的实体识别实验结果及分析
        3.4.3 基于Hierarchical BiLSTM-CRF模型的实体识别实验结果及分析
    3.5 本章小结
4 基于深层语境语言模型的实体识别方法
    4.1 深层语境语言模型BERT
        4.1.1 输入表示
        4.1.2 特征编码
        4.1.3 预训练策略
        4.1.4 相关总结
    4.2 基于BERT语言模型融合CRF的实体识别方法
        4.2.1 相关原理
        4.2.2 实验结果
    4.3 基于BERT语言模型融合Bi LSTM-CRF的实体识别方法
        4.3.1 相关原理
        4.3.2 实验对比及分析
    4.4 本章小结
5 总结与展望
    5.1 全文总结
    5.2 下一步工作展望
参考文献
附录
    A 学位论文数据集
致谢



本文编号:3811094

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3811094.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户9547a***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com