当前位置:主页 > 科技论文 > 软件论文 >

基于Freebase的英文命名实体识别链接的研究与实现

发布时间:2021-04-24 11:01
  随着互联网的不断发展,人们利用网络进行多种多样的沟通交流,网络上也出现越来越多的新闻、百科等非结构化的文本。对这些信息的处理和挖掘能够帮助人们更好的理解文本内容,掌握有价值的信息,加强人们之间有效的交流。命名实体识别和实体链接作为处理文本中实体相关的技术也因此受到国内外研究学者越来越广泛的关注。命名实体识别是识别文本中出现的人名、机构名、地名以及时间等特殊名词的一项任务。实体链接则是将这些文本中的实体链接到知识库中一个无歧义实体的过程。实体对文本内容的理解有很大的帮助,对信息抽取、自动问答、机器翻译等任务也有着重要作用。近年来,大规模知识库在自然语言处理中不断得到应用,知识图谱相关技术迅速发展,命名实体识别和实体链接技术作为构建和应用知识图谱的关键技术之一也得到不断发展。目前该任务面临的主要问题是文本中存在的实体具有多样性和歧义性。一个指称可以代表多个存在的实体,而一个实体也可以同时拥有多个名称。为了克服实体多样性和歧义性给命名实体识别和实体链接任务带来的困难,提出基于双向长短期记忆网络与条件随机场的命名实体识别方法和基于Freebase知识库的神经网络实体链接方法用于从指称的候选实体... 

【文章来源】:北京邮电大学北京市 211工程院校 教育部直属院校

【文章页数】:62 页

【学位级别】:硕士

【文章目录】:
摘要
ABSTRACT
第一章 绪论
    1.1 研究背景和意义
    1.2 研究现状
        1.2.1 命名实体识别
        1.2.2 实体链接
    1.3 本文工作和研究成果
    1.4 本文组织结构
第二章 相关工作
    2.1 知识图谱
        2.1.1 相关知识库
        2.1.2 知识图谱及其应用
    2.2 深度学习
        2.2.1 Word2Vec词向量
        2.2.2 循环神经网络
        2.2.3 长短期记忆网络
        2.2.4 结构化自注意力机制
        2.2.5 多头注意力机制
        2.2.6 记忆网络
第三章 基于Freebase的命名实体识别和实体链接方法
    3.1 预处理
    3.2 指称识别
    3.3 候选实体生成
    3.4 实体选择
        3.4.1 文本编码
        3.4.2 序列注意
        3.4.3 记忆交互
        3.4.4 相似度比较
    3.5 指称聚类
第四章 英文实体识别与链接系统的设计与实现
    4.1 系统设计
    4.2 模块介绍
        4.2.1 预处理模块
        4.2.2 指称识别模块
        4.2.3 候选实体生成模块
        4.2.4 实体选择模块
        4.2.5 指称聚类模块
第五章 实验
    5.1 实验数据
    5.2 实验评价指标
    5.3 实验设置
    5.4 实验结果及分析
        5.4.1 命名实体识别实验结果
        5.4.2 实体链接实验结果
        5.4.3 命名实体识别结果分析
        5.4.4 结构化自注意力机制分析
        5.4.5 记忆网络分析
        5.4.6 相似度计算方法分析
        5.4.7 惩罚项分析
第六章 总结与展望
    6.1 工作总结
    6.2 工作展望
参考文献
致谢
攻读学位期间发表的学术论文目录


【参考文献】:
期刊论文
[1]基于主题敏感的重启随机游走实体链接方法[J]. 李茂林.  北京大学学报(自然科学版). 2016(01)
[2]信息抽取研究综述[J]. 郭喜跃,何婷婷.  计算机科学. 2015(02)



本文编号:3157245

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3157245.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户46b2e***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com