基于神经网络的关系抽取模型研究

发布时间:2023-04-21 20:58
  随着互联网的飞速发展,大量的非结构化文本散布在互联网的各个角落。实体关系抽取能够从非结构化的文本中抽取实体以及实体之间的语义关系,有效地将非结构化文本转化为机器易于处理的结构化文本。关系抽取属于实体关系抽取任务中的一个子任务,是实体关系抽取确定了文本中实体后的后续任务。本文主要研究基于监督学习的句子级别的二元关系抽取模型。近年来,随着深度学习的发展,关系抽取模型取得了较大的进展。然而,关系抽取模型在句子依存树的充分利用上、特殊关系的有效利用上以及是否能够识别关系的方向上依然存在一些需要解决的重要问题。本文对以上三个问题进行了探索和研究,将三方面的贡献总结如下:1.对句子依存树的充分利用进行研究,提出了基于树形自注意力的关系抽取模型。该模型首先利用长短时记忆网络获得句子的词序信息以及利用树形自注意力从句子的依存树中捕捉结构信息。其次,使用一个线性合并层将含有语序信息的向量和含有结构信息的向量进行融合,得到每个单词的最终的向量表示。再次,利用最大池化层获得句子向量和两个实体向量,将它们链接起来输入到前馈神经网络得到关系的向量表示。最后,将关系的向量输入到softmax层中进行关系预测。本章...

【文章页数】:107 页

【学位级别】:博士

【文章目录】:
摘要
abstract
第1章 绪论
    1.1 研究背景与意义
    1.2 国内外研究现状
        1.2.1 基于特征向量的传统方法
        1.2.2 基于核函数的传统方法
        1.2.3 基于深度学习的方法
    1.3 有待研究的问题
    1.4 本文研究内容
    1.5 本文组织结构
    1.6 本章小结
第2章 相关知识介绍
    2.1 长短时记忆网络
    2.2 自注意力机制
    2.3 Transformer Encoder
    2.4 预训练语言模型
    2.5 多任务学习和辅助学习
    2.6 本章小结
第3章 基于树形自注意力的关系抽取
    3.1 引言
    3.2 相关工作
    3.3 模型介绍
        3.3.1 基于树形自注意力的关系抽取
        3.3.2 树形自注意力
    3.4 实验评估
        3.4.1 数据集SemEval-2010 Task8上的实验
        3.4.2 数据集TACRED上的实验
        3.4.3 实验分析
    3.5 本章小结
第4章 辅助学习下的关系抽取
    4.1 引言
    4.2 相关工作
    4.3 方法介绍
        4.3.1 模型表示阶段
        4.3.2 模型学习阶段
    4.4 实验评估
        4.4.1 数据集TACRED上的实验
        4.4.2 数据集SemEval-2010 Task8上的实验
        4.4.3 实验分析
    4.5 本章小结
第5章 关系方向识别
    5.1 引言
    5.2 相关工作
    5.3 任务介绍
        5.3.1 关系方向识别
        5.3.2 评估指标
    5.4 实验评估
        5.4.1 数据集准备
        5.4.2 对EM-C的关系方向评估
    5.5 讨论
        5.5.1 包含实体信息的模型设计
        5.5.2 包含关系方向的模型设计
        5.5.3 模型训练
        5.5.4 案例分析
        5.5.5 关系抽取
    5.6 本章小结
第6章 总结和展望
    6.1 主要工作总结
    6.2 未来工作展望
参考文献
致谢
在读期间发表的学术论文与取得的研究成果



本文编号:3796237

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/xxkjbs/3796237.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户c5e8c***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com