面向中文短文本的关系抽取算法设计

发布时间:2021-09-19 19:23
  海量互联网数据的异构、多源和异质等问题使得高效、精准的知识获取成为巨大的挑战。关系抽取是自然语言处理中的一项基础性任务,从无结构化的文本数据中自动获取结构化的关系型事实,为大规模知识图谱的构建和互联网智能知识服务提供支持。随着深度学习技术的广泛应用,神经关系抽取模型的精度获得了很大提升。然而,现有的主流研究一般关注英语语言的、句子级别的关系抽取。与英语不同,中文表述灵活多变,语法和构词规则相对不固定,大量语义知识蕴含在中文短文本中,通常很难被现有算法有效抽取。本文主要研究面向中文短文本的关系抽取问题。由于中文短文本独特的语言学特征,其关系抽取任务与传统工作相比具有诸多挑战。短文本的语法结构和语义一般不完整,部分短文本蕴含的语义关系属于常识性知识,关系表述的上下文高度稀疏。与英语相比,中文基础自然语言分析较低的准确度,以及短文本关系抽取标注数据集的缺乏也增大了这一问题的难度。本文分别从基于词嵌入的上下位关系抽取、知识增强的语义关系抽取、以及非上下位关系抽取与语义理解等三个方面进行深入研究,设计了面向中文短文本的关系抽取框架,较好地解决了上述挑战。本文的主要工作和贡献概述如下:(1)基于词... 

【文章来源】:华东师范大学上海市 211工程院校 985工程院校 教育部直属院校

【文章页数】:201 页

【学位级别】:博士

【文章目录】:
摘要
abstract
第一章 绪论
    1.1 研究背景
        1.1.1 知识图谱
        1.1.2 分类体系与上下位关系抽取
        1.1.3 通用语义关系抽取
    1.2 面临的挑战
    1.3 整体研究内容与研究思路
    1.4 研究意义
    1.5 主要贡献
    1.6 章节安排
第二章 基于词嵌入的上下位关系抽取
    2.1 引言
    2.2 相关工作
        2.2.1 基于模式匹配的上下位关系抽取
        2.2.2 分布式上下位关系预测
        2.2.3 讨论
    2.3 半监督式上下位关系扩展模型
        2.3.1 算法模型
        2.3.2 实验分析
    2.4 基于转导学习的上下位关系分类模型
        2.4.1 算法模型
        2.4.2 实验分析
    2.5 基于模糊正交投影的上下位关系分类模型
        2.5.1 算法模型
        2.5.2 实验分析
    2.6 小结
第三章 知识增强的语义关系抽取
    3.1 引言
    3.2 相关工作
        3.2.1 对抗学习在NLP的应用
        3.2.2 跨语言迁移学习在NLP的应用
        3.2.3 词汇关系分类
    3.3 基于对抗学习的跨知识源上下位关系融合
        3.3.1 算法模型
        3.3.2 实验分析
    3.4 基于迁移学习的跨语言上下位关系抽取
        3.4.1 算法模型
        3.4.2 实验分析
    3.5 基于超球学习的词汇关系分类
        3.5.1 算法模型
        3.5.2 实验分析
    3.6 小结
第四章 非上下位关系抽取与语义理解
    4.1 引言
    4.2 相关工作
        4.2.1 基于短文本的关系抽取
        4.2.2 常识性关系抽取
        4.2.3 名词短语的习语性分析
    4.3 基于模式挖掘的非上下位关系抽取
        4.3.1 算法模型
        4.3.2 实验分析
    4.4 数据驱动的非上下位关系抽取
        4.4.1 算法模型
        4.4.2 实验分析
    4.5 中文短文本的语义理解
        4.5.1 习语性分类问题
        4.5.2 算法模型
        4.5.3 实验分析
        4.5.4 应用研究
    4.6 小结
第五章 总结与展望
    5.1 总结
    5.2 未来工作展望
参考文献
附录
致谢
简历
攻读博士学位期间发表的学术论文和科研情况



本文编号:3402193

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/xxkjbs/3402193.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户3c520***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com