基于属性图的大规模关联数据的划分方法研究
发布时间:2021-04-29 18:08
近年来,随着社会网络分析、机器学习和数据挖掘等领域的快速发展,关联数据(Linked Data)的规模也在迅速增大。随着大规模关联数据的开放,一个重要的趋势是,以图的形式所表达的数据之间的关联关系变得越发复杂,这些数据使用属性图数据模型表达更为贴切。复杂属性意味着更多的语义约束,通过语义之间的约束可以将属性图数据划分为不同的语义相关层。根据复杂语义信息之间的约束对属性图进行划分,可以在执行查询操作时减少跨分区通信的开销,并且查询结果通常可以在单个划分块得到。然而,传统的图划分方法很少考虑到属性图中的语义约束,因此往往在复杂语义的数据划分中效果并不是很好。为了解决这个问题,该研究提出一种新的查询优化的属性图划分方法。首先,该研究提出将属性语义可达路径作为属性图基本的划分元素,使用该新提出的定义来划分属性图中的语义相关层。其次,为了将路径合并到分区中减少数据冗余,还需要设计实现一种高效的空间压缩算法,通过使用聚合顶点来代替属性语义可达路径进行合并,不需要将整个路径合并起来。在具有代表性的属性图数据上进行的大量严格实验证实了上述属性图数据划分方法在语义丰富的属性图上划分的有效性。在负载平衡、...
【文章来源】:华中科技大学湖北省 211工程院校 985工程院校 教育部直属院校
【文章页数】:57 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
1 绪论
1.1 研究背景和意义
1.2 国内外研究现状
1.3 研究内容
1.4 文章框架结构
2 属性图数据划分系统设计
2.1 系统设计思路
2.2 系统功能模块
2.3 系统处理流程
2.4 本章小结
3 属性图模型构建及其相关定义
3.1 属性图数据模型
3.2 查询语言简介
3.3 属性图查询模型
3.4 本章小结
4 基于属性图的关联数据的划分方法
4.1 概述
4.2 划分算法指标
4.3 数据划分问题描述
4.4 属性语义可达路径划分方法
4.5 查询分解模型
4.6 本章小结
5 系统测试与分析
5.1 测试环境
5.2 测试集与测试方法
5.3 实验对比
5.4 本章小结
6 总结与展望
致谢
参考文献
附录1 攻读学位期间被录用的论文
附录2 攻读学位期间申请的国家发明专利
附录3 攻读学位期间参与的科研项目
本文编号:3167930
【文章来源】:华中科技大学湖北省 211工程院校 985工程院校 教育部直属院校
【文章页数】:57 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
1 绪论
1.1 研究背景和意义
1.2 国内外研究现状
1.3 研究内容
1.4 文章框架结构
2 属性图数据划分系统设计
2.1 系统设计思路
2.2 系统功能模块
2.3 系统处理流程
2.4 本章小结
3 属性图模型构建及其相关定义
3.1 属性图数据模型
3.2 查询语言简介
3.3 属性图查询模型
3.4 本章小结
4 基于属性图的关联数据的划分方法
4.1 概述
4.2 划分算法指标
4.3 数据划分问题描述
4.4 属性语义可达路径划分方法
4.5 查询分解模型
4.6 本章小结
5 系统测试与分析
5.1 测试环境
5.2 测试集与测试方法
5.3 实验对比
5.4 本章小结
6 总结与展望
致谢
参考文献
附录1 攻读学位期间被录用的论文
附录2 攻读学位期间申请的国家发明专利
附录3 攻读学位期间参与的科研项目
本文编号:3167930
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3167930.html