基于知识图谱的非结构化关联规则抽取研究及应用

发布时间:2023-04-01 08:33
  知识图谱用一种结构化的方式存储现实世界存在的知识,由于其知识易于被计算机处理,因此在自然语言处理的许多任务中它都起着极其重要的作用。虽然从绝对数量上来看,现有知识图谱已经包含了海量的三元组事实,但是与真实世界中存在的知识相比它远远不够,因此如何完善知识图谱成为目前的研究热点。本文提出了一种基于非结构化文本增强关联规则的知识推理方法(Natural Language Enhanced Association Rules Mining,NEARM)。使用该规则可以将自然文本中包含的三元组事实推理出来用以完善知识图谱。本文的工作有:1.为了从非结构化的文本中抽取三元组事实,本文使用密度峰值算法对关系文本聚类,其中涉及到的句子相似度计算使用改进的LSWMD算法。为了提高算法效率,本文还利用基于K-BoD的文本聚类算法对其进行改进。2.为了将类簇建模为一个统一的表达方式放入到非结构化关联规则中,本文提出了改进的BoD(BoD-GS,基于高斯分布的文本模式建模)和BoD-TDGS(基于二维高斯分布的文本模式建模)来建模关系文本。实验结果表明,较于BoD-GS,BoD-TDGS更为准确合理。3.研究...

【文章页数】:55 页

【学位级别】:硕士

【文章目录】:
摘要
abstract
第1章 绪论
    1.1 研究的背景和意义
    1.2 国内外研究现状
        1.2.1 知识图谱研究现状
        1.2.2 知识图谱完善研究现状
    1.3 论文主要工作
    1.4 论文组织结构
第2章 相关技术介绍
    2.1 句子聚类
    2.2 文本模式建模
    2.3 关系分类
    2.4 本章小结
第3章 非结构化关联规则抽取
    3.1 引言
    3.2 问题定义
    3.3 NEARM算法
        3.3.1 关系文本聚类
        3.3.2 文本模式建模
        3.3.3 非结构化文本增强的关联规则挖掘
    3.4 实验
        3.4.1 数据集描述及实验设置
        3.4.2 对比方法
        3.4.3 评估方法
        3.4.4 实验结果分析
        3.4.5 样例分析
    3.5 本章小结
第4章 基于K-BoD文本聚类的NEARM算法
    4.1 引言
    4.2 K-BoD文本聚类算法
    4.3 基于二维高斯分布的文本模式建模
    4.4 实验和结果分析
        4.4.1 对比方法
        4.4.2 评估方法
        4.4.3 实验结果分析
        4.4.4 样例分析
    4.5 仿真实验验证
        4.5.1 仿真实验目标
        4.5.2 仿真实验流程
        4.5.3 仿真实验结果展示
    4.6 本章小结
第5章 总结与展望
    5.1 主要工作与创新点
    5.2 后续研究工作
参考文献
致谢
攻读硕士学位期间从事的科研工作及取得的成果



本文编号:3776814

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3776814.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户ff03b***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com