基于NoSQL的社交网络图数据可达性索引技术研究

发布时间:2018-06-02 18:52

  本文选题:大规模图数据 + NoSQL ; 参考:《沈阳航空航天大学》2017年硕士论文


【摘要】:随着云计算等新技术的快速发展、社交网络等新型互联网应用的兴起,人类获取和存储数据的规模正以前所未有的速度爆炸式增长,与大规模图数据相关的技术变革成为学术界和工业界的热点问题。针对大规模图数据的可达查询是一项基础性查询,在图分析及处理中被频繁使用,将一些复杂的查询分解成包含多个可达查询的操作集合,其高效处理具有重要意义。现有的可达索引机制在面对大规模图时呈现查询效率低或索引代价过大的问题,为此,本文对大规模有向图的可达查询进行了深入的研究。首先,提出了一种基于NoSQL的面向大规模图数据的分布式可达性索引与查询框架,在不破坏原图中节点可达性的前提下,将大规模图进行划分成若干个子图作为预处理,通过创建跨边集来保留原图中各子图间的可达性信息。由于子图可达性保持算法保留原图中各子图内节点间的可达性信息,从而使各子图可并行生成可达性索引。其次,设计了基于所提框架的查询处理算法。算法预先判断查询节点所属子图的可达性信息,可直接返回一部分不可达结果。对于一般查询,最多进行两次子图内部的可达性查询即可返回查询结果。最后,通过真实数据集的实验与现有方法对比,验证了本文提出的基于NoSQL的面向大规模图数据的分布式可达性索引与查询框架在大规模稀疏图和稠密图上创建索引所需的时间短,生成的索引规模小,且具有良好的查询性能。
[Abstract]:With the rapid development of new technologies such as cloud computing and the rise of new Internet applications such as social networks, the scale of human access to and storage of data is exploding at an unprecedented rate. The technological change related to large-scale map data has become a hot issue in academia and industry. The reachable query of large-scale graph data is a basic query, which is frequently used in graph analysis and processing. Some complex queries are decomposed into sets of operations containing multiple reachable queries, and its efficient processing is of great significance. The existing reachability indexing mechanism presents the problem of low query efficiency or excessive index cost in the face of large-scale graph. Therefore, this paper makes a deep research on the reachable query of large-scale directed graph. Firstly, a distributed reachability index and query framework for large-scale graph data based on NoSQL is proposed. Without destroying the reachability of nodes in the original graph, the large-scale graph is divided into several sub-graphs as preprocessing. By creating cross-edge sets, the reachability information between subgraphs in the original graph is preserved. Because the reachability preserving algorithm of subgraph preserves the reachability information between nodes in each subgraph of the original graph, each subgraph can generate reachability index in parallel. Secondly, the query processing algorithm based on the proposed framework is designed. The algorithm prejudges the reachability information of the subgraph of the query node and directly returns some unreachable results. For a general query, a maximum of two subgraphs within the reachability query can return the query results. Finally, the experiments of real data sets are compared with existing methods. It is verified that the proposed NoSQL based distributed reachability index and query framework for large scale graph data takes a short time to create indexes on large scale sparse graphs and dense graphs, and the generated indexes are small in size and have good query performance.
【学位授予单位】:沈阳航空航天大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:O157.5

【相似文献】

相关期刊论文 前10条

1 林宗振;;关于均匀钱币投掷过程的可达性[J];暨南理医学报(理科专版);1985年03期

2 许世蒙,张玉忠;有交易费的折算资产优化性质和可达性[J];控制理论与应用;2002年01期

3 李平华,陆玉麒;可达性研究的回顾与展望[J];地理科学进展;2005年03期

4 贾鹏;刘瑞菊;杨忠振;;基于陆域和空域运输系统的空港可达性评价方法研究[J];经济地理;2013年06期

5 姜海宁;谭石柳;;轨道交通建设对金华城镇可达性格局的影响[J];浙江师范大学学报(自然科学版);2014年02期

6 刘俊;陆玉麒;;江苏省公路交通网络可达性评价研究[J];南京师大学报(自然科学版);2008年03期

7 刘志林;王茂军;;北京市职住空间错位对居民通勤行为的影响分析——基于就业可达性与通勤时间的讨论[J];地理学报;2011年04期

8 蒋晓威;曹卫东;罗健;朱胜清;唐云云;;安徽省公路网络可达性空间格局及其演化[J];地理科学进展;2012年12期

9 刘俊;陆玉麒;孟德友;;基于不同指标的公路交通网络可达性评价——以江苏省为例[J];工业技术经济;2009年02期

10 袁立科;张宗益;;创新系统的区域可达性研究[J];科研管理;2007年01期

相关会议论文 前10条

1 苗梅;Gerhard Weber;;推广可达性[A];第四届和谐人机环境联合学术会议论文集[C];2008年

2 吕斌;张纯;陈天鸣;;城市低收入群体的就业可达性变化研究:以北京为例[A];多元与包容——2012中国城市规划年会论文集(13.城市规划管理)[C];2012年

3 裴玉龙;盖春英;;公路网络可达性研究[A];科技、工程与经济社会协调发展——中国科协第五届青年学术年会论文集[C];2004年

4 尹海伟;徐建刚;祁毅;;上海公园空间可达性与公平性分析[A];中国地理学会2007年学术年会论文摘要集[C];2007年

5 张莉;陆玉麒;赵元正;;基于可达性的长江三角洲城市一日交流圈的动态变化研究[A];地理学核心问题与主线——中国地理学会2011年学术年会暨中国科学院新疆生态与地理研究所建所五十年庆典论文摘要集[C];2011年

6 孟德友;范况生;高超;;铁路客运提速前后省际可达性及空间格局分析[A];中国地理学会百年庆典学术论文摘要集[C];2009年

7 刘志林;王茂军;;北京市职住空间错位对居民通勤行为的影响分析——基于就业可达性与通勤时间的讨论[A];中国地理学会百年庆典学术论文摘要集[C];2009年

8 张宇;张英杰;张晓东;郑猛;;北京市区位可达性对房价影响分析[A];规划创新:2010中国城市规划年会论文集[C];2010年

9 朱琛;孙姗珊;;城市不同居住区位群体就业可达性差异研究——以上海市为例[A];城市时代,协同规划——2013中国城市规划年会论文集(07-居住区规划与房地产)[C];2013年

10 杨育军;;可达性评价方法的比较:一种基于GIS的实证方法[A];中国地理信息系统协会第八届年会论文集[C];2004年

相关硕士学位论文 前10条

1 丁振;既有路网下基于中小城市的快速通道网布局研究[D];西南交通大学;2015年

2 彭\~\~;基于区间标记索引的可达性查询设计及其在外包数据库中的应用[D];哈尔滨工业大学;2014年

3 薛鹏;图数据上可达性查询关键技术研究[D];东北大学;2014年

4 李建新;基于可达性的南昌市区域空间效应研究[D];江西师范大学;2015年

5 刘红;基于老年人游憩特征的长沙市公园可达性研究[D];湖南师范大学;2015年

6 王于楠;基于公路可达性的青海省人口时空格局演变研究[D];青海师范大学;2016年

7 李U,

本文编号:1969820


资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/benkebiyelunwen/1969820.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户b0d40***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com