当前位置:主页 > 管理论文 > 信贷论文 >

面向金融领域的知识图谱构建及补全研究

发布时间:2021-12-18 02:38
  全球范围内伴随着云计算,大数据,人工智能等新兴技术的落地,互联网的数据量每两年翻一番,为了更好的分析及应用互联网数据,国内外学者及机构提出知识图谱概念。知识图谱将客观世界中概念,实体及其关系以结构化的形式呈现,以更直观让人类认识世界的形式将互联网的信息进行表达,在管理、组织及分析应用互联网信息上发挥出了巨大的作用。目前,知识图谱已经在医疗、商业及交通等行业领域得到了较好的应用且取得了良好的效果。但是目前针对金融行业的知识图谱相对较少,很多公司的金融图谱因信息的私密性不对外开放且应用时发现有隐含的关系尚未连接,因此在知识图谱构建完成后,后续的补全工作也变的尤为重要。经典的知识图谱补全模型往往只关注知识图谱中相邻的两个节点所组成的路径,忽略了节点与其它多个节点所组成的关系路径所带来的信息。本文针对金融图谱缺乏问题及知识图谱补全模型的缺陷,先利用金融股票及企业信息进行金融知识图谱构建,一方面以金融股票等信息为例描述金融知识图谱的构建方法,另一方面为后期知识补全任务提供基础数据集,然后提出基于组合关系路径的知识图谱补全方法对金融知识图谱进行补全任务验证。主要工作包括:1.基于金融知识图谱的缺乏... 

【文章来源】:青岛大学山东省

【文章页数】:54 页

【学位级别】:硕士

【部分图文】:

面向金融领域的知识图谱构建及补全研究


知识图谱检索示例

示意图,知识获取,示意图,知识图


青岛大学硕士学位论文7第二章知识图谱构建流程及补全方法概述知识图谱将客观世界中概念,实体及其关系以结构化的形式进行表示,通过知识图谱,可以实现概念链接替换网页链接,支持用户按相应的主题或者概念检索,从而实现真正的语义检索。因为在知识图谱中,自顶向下的建模方式需要领域专家的参与,因此在本章中,我们主要介绍自底向上的基本知识。自底向上构建方法是一个不断更新的过程。主要包括三个步骤:1)知识抽取,从所获取的数据信息中抽取有价值的实体,属性及关系;2)知识融合,将获得的新知识进行融合或者链接,消除歧义;3)知识存储,对于经过融合的知识,经过评估后存储到相应的数据库以支持后续的查询及计算工作。2.1知识图谱构建流程2.1.1知识抽取知识图谱构建的首要工作即是知识抽取,知识图谱中的知识来源于图2.1所示的结构化,半结构化和非结构化的信息资源,其中的关键问题是如何运用知识抽取技术从获得的信息资源中提取出计算机可理解和计算的结构化数据,以进行下一步的分析及利用。知识抽取任务细分为实体抽取,属性抽取,关系抽取三大部分。图2.1知识获取示意图2.1.1.1实体抽取实体抽取:实体抽取又称为命名实体识别(NamedEntityRecognition,)[23],是将专有名

知识存储,方式,属性图,表结构


青岛大学硕士学位论文102.1.3知识存储知识存储是对所获得的知识进行存储以支持后期的查询及计算,知识存储的对象包括基本属实体知识、属性知识、关联知识等。从存储结构划分,知识存储分为基于表结构的存储和基于图结构的存储[40],如图2.2所示。图2.2知识存储方式基于表结构的存储,是指对知识图谱中的数据进行存储时与以往常规数据类似,采用数据表进行存储。不同的表结构具有不同的设计规则,如常见的关系数据库。这些表结构表示数据简单直接,易于理解,但整个知识图谱的数据存储在一张表,导致单表的规模太大,相应的增删改查操作开销也较大。基于图结构的存储即使用图模型描述和存储图谱数据,这种方式能够直接反应图谱的内部结构,有利于知识的查询,结合图计算算法,进行知识的深度挖掘与推理。目前业界公认的图模型有3种,分别是属性图(PropertyGraph)、资源描述框架(RDF)、三元组超图(HyperGraph),其中属性图和资源描述框架已广泛应用到多个图数据库产品中。属性图或带标签的属性图(Labeled-PropertyGraph),由顶点、边,属性和标签构成,顶点和标签也可以有标签。常见的属性图结构如图2.3所示


本文编号:3541458

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/bankxd/3541458.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户f5d3d***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com