基于知识图谱的非结构化关联规则抽取研究及应用

发布时间：2023-04-01 08:33

　　知识图谱用一种结构化的方式存储现实世界存在的知识,由于其知识易于被计算机处理,因此在自然语言处理的许多任务中它都起着极其重要的作用。虽然从绝对数量上来看,现有知识图谱已经包含了海量的三元组事实,但是与真实世界中存在的知识相比它远远不够,因此如何完善知识图谱成为目前的研究热点。本文提出了一种基于非结构化文本增强关联规则的知识推理方法(Natural Language Enhanced Association Rules Mining,NEARM)。使用该规则可以将自然文本中包含的三元组事实推理出来用以完善知识图谱。本文的工作有:1.为了从非结构化的文本中抽取三元组事实,本文使用密度峰值算法对关系文本聚类,其中涉及到的句子相似度计算使用改进的LSWMD算法。为了提高算法效率,本文还利用基于K-BoD的文本聚类算法对其进行改进。2.为了将类簇建模为一个统一的表达方式放入到非结构化关联规则中,本文提出了改进的BoD(BoD-GS,基于高斯分布的文本模式建模)和BoD-TDGS(基于二维高斯分布的文本模式建模)来建模关系文本。实验结果表明,较于BoD-GS,BoD-TDGS更为准确合理。3.研究...

【文章页数】：55 页

【学位级别】：硕士

【文章目录】：
摘要
abstract
第1章绪论
    1.1 研究的背景和意义
    1.2 国内外研究现状
        1.2.1 知识图谱研究现状
        1.2.2 知识图谱完善研究现状
    1.3 论文主要工作
    1.4 论文组织结构
第2章相关技术介绍
    2.1 句子聚类
    2.2 文本模式建模
    2.3 关系分类
    2.4 本章小结
第3章非结构化关联规则抽取
    3.1 引言
    3.2 问题定义
    3.3 NEARM算法
        3.3.1 关系文本聚类
        3.3.2 文本模式建模
        3.3.3 非结构化文本增强的关联规则挖掘
    3.4 实验
        3.4.1 数据集描述及实验设置
        3.4.2 对比方法
        3.4.3 评估方法
        3.4.4 实验结果分析
        3.4.5 样例分析
    3.5 本章小结
第4章基于K-BoD文本聚类的NEARM算法
    4.1 引言
    4.2 K-BoD文本聚类算法
    4.3 基于二维高斯分布的文本模式建模
    4.4 实验和结果分析
        4.4.1 对比方法
        4.4.2 评估方法
        4.4.3 实验结果分析
        4.4.4 样例分析
    4.5 仿真实验验证
        4.5.1 仿真实验目标
        4.5.2 仿真实验流程
        4.5.3 仿真实验结果展示
    4.6 本章小结
第5章总结与展望
    5.1 主要工作与创新点
    5.2 后续研究工作
参考文献
致谢
攻读硕士学位期间从事的科研工作及取得的成果

本文编号：3776814

资料下载

论文发表

支付宝下载

Download by Alipay
微信下载

Download by Wechat
会员下载

Download by Member

本文链接：https://www.wllwen.com/kejilunwen/shengwushengchang/3776814.html

上一篇：基于区域划分的快速多聚焦图像融合
下一篇：基于深度学习的鼻咽癌与心脏MRI医学图像分类与分割研究

论文发表

·知网|万方|维普|龙源|省级|国家级|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|