基于知识图谱的企业画像技术研究与实现
发布时间:2025-02-11 19:45
近年来,企业画像方面的研究开始出现,企业画像相关的产品也开始应用于政府机构和企业。然而很多企业画像研究仅仅是接入特定的企业信息数据源,借助地图或者图表展示企业信息。事实上企业信息中蕴含着大量的隐藏知识。本文以企业知识图谱为支撑,融合多个方面的企业信息,推理出隐藏在表层企业信息之下的知识来对企业进行画像。本文提出了基于知识图谱的企业画像。用知识图谱融合从互联网上众多数据源获取到的企业信息,用于构建企业知识库,并运用马尔可夫逻辑网进行知识学习,以及知识补全。本文构建的企业知识图谱总体上可以分为三层:最底层的企业实体关系图、中间层的马尔可夫逻辑网实体层面、最上层的马尔可夫逻辑网知识层面。子句可以用于马尔可夫网推理来补全知识图谱,也可以用于挖掘隐藏在表层企业信息之下的知识,比如企业的研究方向、异常的企业员工。并以本文构建的企业知识图谱为基础对企业进行画像。本文根据企业知识库已有的数据分析得出模式图并设计谓词,在此基础上本文使用了马尔可夫逻辑网知识学习算法DSL算法,得到了知识的载体子句及其权重。基本的企业知识库的实体关系是稀疏的,缺乏层次性,而通过马尔可夫逻辑网进行知识推理可以补全一部分实体间关...
【文章页数】:67 页
【学位级别】:硕士
【部分图文】:
本文编号:4033768
【文章页数】:67 页
【学位级别】:硕士
【部分图文】:
图2-2企业基本信息数据源分布图
维基百科等也提供了企业详细信息。部分数据信息如图2-2、2-3所示。图2-2企业基本信息数据源分布图
图2-3企业员工信息数据源分布图
图2-3企业员工信息数据源分布图私保护与匿名化处理网早已深入到人们的日常生活中。人们在互联网上通过个人网名、地址等与他人交流。事实上这些信息都属于个人隐私
图2-5JanusGraph架构图
图2-5JanusGraph架构图企业信息预处理不同数据源对日期的表达方式是多种多样的,需要针对特定的表达方式换。常见的日期格式有“yyyy-MM-ddHH:mm:SS”、“yyyy-MM-dd
图2-6企业基本信息属性图
-16-图2-6企业基本信息属性图
本文编号:4033768
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/4033768.html