基于深度学习的远程监督关系抽取

发布时间:2023-02-01 20:07
  信息时代的急速发展使得人们在互联网上存储及运用的文本数据规模急剧增加。为了从海量的文本中发现目标信息,信息抽取技术应运而生。作为信息抽取领域重要的研究课题,针对实体关系抽取的研究,其根本目的在于从半结构文本或非结构文本中发现实体之间的语义关系,以便人们快速的理解复杂文本中的隐藏信息。具有较强的研究价值和研究意义。本文主要研究了在远程监督数据集上的关系抽取任务的实现,基于深度学习技术与远程监督思想提出了一种新的实体关系抽取方法。针对远程监督数据的特点,在总结现有的研究基础上,本文分别从实体关系特征提取和抑制噪音数据影响两个方面开展研究。在实体关系特征提取方面,以往的关系抽取研究中深度学习模型通常只包含浅层卷积神经网络结构,设计的模型只能提取到浅层的语义信息,因此本文从网络深度的角度出发,通过引入深度残差网络技术以提取更高层的特征语义信息使模型可以学习到更丰富的关系特征,设计了多层网络模型实验以探索更适合的模型深度;在抑制噪音数据影响方面,现有的研究偏重于引入句法结构等信息,需要大量的专家知识,而本文从句子信息对目标关系的重要性角度出发,在池化层引入注意力机制用以自动捕捉更加关键的特征信息... 

【文章页数】:61 页

【学位级别】:硕士

【文章目录】:
摘要
Abstract
1 绪论
    1.1 研究背景
    1.2 研究意义
    1.3 国内外研究概况
    1.4 研究内容
    1.5 本文的组织结构
2 相关理论与技术分析
    2.1 远程监督
    2.2 实体关系抽取
    2.3 远程监督数据集及评价标准
    2.4 本章小结
3 基于Res Net的远程监督关系抽取
    3.1 引言
    3.2 卷积神经网络
    3.3 CNN模型设计
    3.4 Res Net模型设计
    3.5 实验与分析
        3.5.1 实验流程
        3.5.2 多层网络模型实验设计
        3.5.3 层数加深的效应分析
    3.6 本章小结
4 基于Attention Pooling的远程监督关系抽取
    4.1 引言
    4.2 NLP中的注意力机制
    4.3 Attention Pooling学习模型
    4.4 实验与分析
        4.4.1 实验流程
        4.4.2 Attention Pooling Model实验设计
        4.4.3 注意力机制对噪音数据的抑制效应分析
    4.5 本章小结
5 结合注意力机制与深度残差网络的远程监督关系抽取
    5.1 引言
    5.2 远程监督数据预处理
        5.2.1 词嵌入
        5.2.2 位置嵌入
        5.2.3 数据填充
    5.3 ARCNN学习模型
        5.3.1 输入映射层
        5.3.2 Convolution,Res Net
        5.3.3 Attention Pooling,Softmax Output
        5.3.4 训练和优化策略
    5.4 实验与分析
        5.4.1 实验流程
        5.4.2 ARCNN模型实验设计
        5.4.3 ARCNN模型性能分析
    5.5 本章小结
6 总结与展望
    6.1 论文总结
    6.2 未来展望
参考文献
致谢
附录1 攻读硕士学位期间参与的项目和发表的论文



本文编号:3734418

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3734418.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户5251d***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com