当前位置:主页 > 社科论文 > 图书档案论文 >

基于多源数据的高校学术知识图谱构建及其应用研究

发布时间:2023-02-10 21:53
  知识图谱是Google公司提出的一种大规模语义网络,旨在描述现实世界中存在的各种实体、概念及关系,作为大数据时代的重要知识表示方法,知识图谱已经成为人工智能的关键技术之一,被广泛应用于社交网络、智能推荐、深度问答等领域。学术数据是高校的一类重要数据,能够反映高校的综合科研能力和创新能力,然而,学术数据具有体量大、多源性、多样性和动态性等特点,如何对学术数据进行组织和管理进而对数据进行分析成为一个重要的研究内容。为此,本文对高校学术知识图谱构建与表示学习模型进行了研究,主要研究内容和成果包括:(1)针对学术数据格式多源性和多样性的特点,构建了基于多源数据的高校学术知识图谱,从非结构化数据、半结构数据和结构化数据等多种类型的数据源中抽取实体、关系及属性等知识要素,并组织成三元组形式,再通过知识融合算法将抽取得到的三元组融合成统一的知识图谱,为数据分析提供结构化知识库。(2)针对知识图谱数据稀疏和复杂度高等问题,提出了基于语义向量的知识图谱表示学习模型(Trans V),引入文本语料库和知识图谱上下文为实体及关系构建语义向量,并为关系设计语义矩阵,从语义角度实现对知识图谱的深度扩展,设计的新...

【文章页数】:80 页

【学位级别】:硕士

【文章目录】:
摘要
ABSTRACT
第一章 绪论
    1.1 研究背景及意义
    1.2 国内外研究现状
        1.2.1 知识图谱构建研究现状
        1.2.2 表示学习模型研究现状
        1.2.3 知识图谱应用研究现状
    1.3 论文研究内容
    1.4 论文组织结构
第二章 知识图谱相关技术
    2.1 知识图谱构建
        2.1.1 知识抽取
        2.1.2 知识融合
        2.1.3 知识加工
    2.2 知识图谱表示学习
        2.2.1 表示学习的概念
        2.2.2 翻译表示学习模型
    2.3 本章小结
第三章 基于多源数据的高校学术知识抽取与融合方法
    3.1 高校学术知识图谱技术架构
    3.2 非结构化表格数据的知识抽取
        3.2.1 单值表格知识抽取
        3.2.2 多值表格知识抽取
    3.3 半结构化数据的知识抽取
    3.4 结构化数据的知识抽取
    3.5 多源数据的知识融合算法
    3.6 实验结果与分析
    3.7 本章小结
第四章 基于语义向量的知识图谱表示学习模型研究
    4.1 Trans V模型的原理
    4.2 Trans V模型的框架
    4.3 基于BERT的语义向量构建
        4.3.1 BERT模型概述
        4.3.2 实体及关系语义向量构建
        4.3.3 关系语义矩阵构建
    4.4 Trans V的训练函数
    4.5 实验结果与分析
        4.5.1 实验环境
        4.5.2 链接预测
        4.5.3 三元组分类
    4.6 本章小结
第五章 基于知识图谱的高校学术数据分析原型系统开发
    5.1 系统概述
    5.2 系统总体设计
    5.3 知识图谱开发
    5.4 数据分析模块
        5.4.1 教师画像
        5.4.2 学者合作关系
        5.4.3 论文发表情况
        5.4.4 学者研究方向
    5.5 本章小结
第六章 结论与展望
    6.1 结论
    6.2 展望
参考文献
致谢
作者简介
    1 作者简历
    2 攻读硕士学位期间发表的学术论文
    3 参与的科研项目及获奖情况
    4 发明专利
学位论文数据集



本文编号:3739978

资料下载
论文发表

本文链接:https://www.wllwen.com/tushudanganlunwen/3739978.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户a3b0a***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com