多源人物属性融合方法研究

发布时间:2023-11-25 17:54
  近年来,人物知识图谱在智能问答、人物关系分析、搜索引擎等场景得到了极大的应用,覆盖了金融、互联网、医疗、政务等领域。结构化数据诸如维基百科、百度百科及其他行业数据库是构建人物知识图谱的优选数据源。然而与结构化数据相比,互联网还存储了更多的非结构数据源,同样包含丰富的人物属性信息。如何从非结构化数据源中准确提取人物信息用于构建人物知识图谱是当前人物知识图谱构建领域的热点研究问题。为此本文在对现有的相关研究进行深入分析的基础上,提出了基于依存树剪枝的图卷积网络人物属性抽取模型、基于嵌入表达的知识图谱实体对齐模型以及基于属性类型的属性对齐模型,实现了从非结构化数据源中准确提取用户属性并构建知识图谱的过程。具体的研究如下:1)针对现有基于依存树的关系抽取模型存在依存树修剪过度导致关键信息被裁减的问题,本文提出了基于依存树剪枝的图卷积网络关系抽取模型。该模型先以实体和最短依存路径为中心对依存树剪枝后得到剪枝依存树的邻接矩阵,随后将句子的词向量和邻接矩阵作为图卷积网络的输入得到每个词汇的隐式表达,然后采用基于实体类型嵌入和位置的注意力机制得到句子的表达,最后进行关系分类。实验表明了该模型在Sem ...

【文章页数】:82 页

【学位级别】:硕士

【文章目录】:
摘要
abstract
第一章 绪论
    1.1 研究背景及意义
    1.2 国内外研究现状
    1.3 论文的主要工作与贡献
    1.4 论文章节安排
第二章 相关理论基础和技术
    2.1 自然语言处理的相关概念
    2.2 本文运用的基本理论
        2.2.1 文本的表示方法
        2.2.2 依存树以及常见剪枝方法
        2.2.3 注意力机制
        2.2.4 图卷积网络
        2.2.5 图注意力网络
    2.3 文本采集与处理工具
    2.4 本章小结
第三章 基于依存树剪枝的图卷积网络人物关系抽取方法研究
    3.1 研究背景
    3.2 基于依存树剪枝的图卷积网络人物关系抽取模型
        3.2.1 训练词向量模型
        3.2.2 依存树剪枝方法
        3.2.3 图卷积神经网络
        3.2.4 注意力机制
        3.2.5 分类输出层
    3.3 实验与分析
        3.3.1 实验数据与评价指标
        3.3.2 实验参数设置
        3.3.3 结果和分析
    3.4 本章小结
第四章 基于嵌入表示的知识图谱实体对齐方法研究
    4.1 研究背景
    4.2 基于嵌入表示的知识图谱实体对齐模型
        4.2.1 数据定义和预处理
        4.2.2 结构嵌入
        4.2.3 属性嵌入
        4.2.4 实体对齐
    4.3 实验与分析
        4.3.1 实验数据与评估指标
        4.3.2 实验参数设置
        4.3.3 结果和分析
    4.4 本章小结
第五章 基于属性类型的属性对齐方法研究
    5.1 研究背景
    5.2 基于属性类型的属性对齐模型
        5.2.1 属性对齐模型的数据定义和算法流程
        5.2.2 属性名相似度计算方法
        5.2.3 属性值相似度计算方法
        5.2.4 对齐属性对的融合方法
    5.3 实验与分析
        5.3.1 实验数据与评估指标
        5.3.2 实验参数设置
        5.3.3 实验分析
    5.4 本章小结
第六章 总结和展望
    6.1 工作总结
    6.2 工作展望
致谢
参考文献
攻读硕士学位期间取得的研究成果



本文编号:3867566

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3867566.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户90965***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com