构建Web数据空间的若干关键技术研究
本文选题:Web数据集成 + 数据空间 ; 参考:《南京航空航天大学》2016年博士论文
【摘要】:随着互联网技术的快速发展,Web已经成为一个巨大的信息宝库,拥有海量的数据,成为人们日常生活、电子政务和电子商务等领域不可或缺的部分。为了有效的利用Web上的数据资源,目前已经有很多专门用于Web数据处理的方法:Web数据挖掘、Deep Web数据集成、利用语义技术重构Web而建立的语义Web等。数据空间是针对新的数据特点和数据管理技术的抽象与概括,其本质是解决数据集成问题。数据空间是一个实体所拥有的所有数据的集合。Web数据空间系统是通过集成演化的构建方法,为实现用户所关心的Web上数据访问而建设的一个可持续改进的与可逐渐实现Web语义集成的Web数据集成系统。建设Web数据空间系统的目的是为个人或组织有效地利用Web数据提供一种解决方案。围绕如何构建一个Web数据空间需要解决的关键问题:系统框架、数据模型、数据源选择、模式集成、访问控制等方面开展了研究工作,具体的研究成果如下:(1)提出了Web数据空间的系统框架与构建原则。在数据空间数据集成理念的基础上,结合Web数据的特点,分析了Web数据空间的一些主要特征,给出了构建一个Web数据空间系统的一些基本原则:能够管理Web上的所有数据、使用集成演化数据构建原则、充分利用现有技术、利用协作方式、便利的数据分享方式等。设计了Web数据空间的系统框架,给出了各部分的详细功能,最后详细的讨论了使用显式反馈与隐式反馈实现Web系统空间进化的一些问题。(2)设计了Web数据空间系统的数据模型。基于RDF模型,设计完成了Web数据空间数据模型。模型首先通过RDF建立了一个数据视图,该视图实现了Web上所有数据的统一表示。具体应用时需要针对具体类型的数据进行实例化,具体的实例化模型包括:网页数据、文件文件夹、Deep Web、数据流、关联数据等。该模型可以实现Web上所有数据的统一建模,在单一模型内部实现非结构化、结构化以及结构化数据的统一表示与访问。(3)提出了一种基于用户查询与数据源中间模式关联度、数据源数据质量、数据源最小查询代价综合考量的Web数据源选择方法。该方法分为两个阶段:第一个阶段根据查询与数据源的关联度、数据源质量选择数据源;第二个阶段使用最小查询代价模型动态选择第一阶段已经选择的数据源,满足用户k个查询记录的需求。在最小查询代价模型算法的设计中,使用了最大熵模型计算数据源之间的重复度。(4)提出了一个Web数据空间数据模式集成与映射方法。首先给出了Web数据空间模式集成的框架,然后运用组合的方法,基于K-中心点算法实现了中间模式的自动集成,最后提出了使用Top-k个模式与用户查询进行映射与匹配的方法,提高了用户查询的准确率与召回率,同时给出了使用集成演化的方法提高查询精度的方法。(5)设计了一个细粒度的基于上下文的访问控制模型。基于XACML模型,运用目前的一些语义技术:使用OWL描述主体、客体、操作与环境,使用SWRL实现语义推理,设计完成了一个细粒度的可以实现对关联数据数据空间的访问控制模型。模型中使用语义范围方法大大减少了访问规则的定义,相关语义技术的使用可以实现对数据空间数据上下文的访问控制。
[Abstract]:With the rapid development of Internet technology , the Web has become a huge information treasure house , which is an indispensable part in the fields of daily life , e - government and e - commerce . ( 3 ) A method for selecting Web data sources based on correlation between user query and data source , data quality of data source and minimum query cost of data source is proposed . The method includes two stages : the first stage selects the data source according to the relation between the query and the data source , the data source quality selects the data source , and the second stage uses the minimum query cost model to dynamically select the data source which has been selected in the first stage .
【学位授予单位】:南京航空航天大学
【学位级别】:博士
【学位授予年份】:2016
【分类号】:TP311.13;TP393.09
【相似文献】
相关期刊论文 前10条
1 杨红爵;;略论数据空间[J];成功(教育);2009年01期
2 郭莹;;数据空间关键问题探究[J];软件导刊;2012年07期
3 厉剑;张绍雄;刘俊杰;李成柱;;大数据引发信息时代新变革[J];大众科技;2013年12期
4 李斌;;大数据及其发展趋势研究[J];广西教育;2013年35期
5 张晓军;孟祥武;;数字化周期[J];计算机科学;2002年05期
6 崔晨;吴扬扬;;基于活动的数据空间数据关系发现[J];微型机与应用;2011年11期
7 贾云得;;微型数字存贮遥测装置数据预存贮方法[J];遥测遥控;1989年06期
8 靳小龙;王元卓;程学旗;;大数据的研究体系与现状[J];信息通信技术;2013年06期
9 朝乐门;;数据空间及其信息资源管理视角研究[J];情报理论与实践;2013年11期
10 黄一凡;;合并分区 数据无损有妙招[J];电脑爱好者;2011年23期
相关会议论文 前5条
1 李鸿奎;陈洪艳;;大连市房地产基础地理信息系统的设计和建设[A];中国地理信息系统协会第九届年会论文集[C];2005年
2 董彦磊;申德荣;寇月;聂铁铮;;数据空间中数据组织模型以及关联关系发现模型的研究[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
3 庞怡;许洪光;张志敏;;针对海量科技信息的存储研究[A];信息时代——科技情报研究学术论文集(第三辑)[C];2008年
4 季承;;Oracle利用HWM高水标记收缩数据空间方案[A];2013电力行业信息化年会论文集[C];2013年
5 季承;;Oracle利用HWM高水标记收缩数据空间方案[A];2013电力行业信息化年会论文集[C];2013年
相关重要报纸文章 前6条
1 牛泽亚;用户如何在数据空间里“被遗忘”?[N];人民邮电;2014年
2 风格;指引大数据未来发展方向的九大真理[N];中华读书报;2013年
3 录音整理 本报记者 刘文强 杨丰源;创新驱动,奋力奔向大数据时代[N];贵阳日报;2014年
4 中国人民大学信息学院 李玉坤;云计算与数据空间[N];中国计算机报;2008年
5 整理 本报记者 苏丹丹;把握大数据机遇 推动文化产业跨越发展[N];中国文化报;2013年
6 安徽国税局 赵为民;税务综合数据平台的设想[N];计算机世界;2007年
相关博士学位论文 前10条
1 李晓娜;面向SaaS应用的多租户数据放置机制研究[D];山东大学;2015年
2 张德兵;基于机器学习的数据补全、标注和检索若干问题研究[D];浙江大学;2015年
3 刘思彤;空间文本数据的查询处理技术研究[D];清华大学;2015年
4 侯振隆;重力全张量梯度数据的并行反演算法研究及应用[D];吉林大学;2016年
5 柯余洋;面向三类应用数据的智能分析与优化研究[D];中国科学技术大学;2016年
6 刘正涛;构建Web数据空间的若干关键技术研究[D];南京航空航天大学;2016年
7 姜朔;数据空间中数据集成若干关键问题研究[D];东华大学;2014年
8 陈鹏;面向情景感知计算的时空数据管理、查询、分析与相关算法研究[D];华东师范大学;2013年
9 杨丹;数据空间中基于语义的实体搜索关键技术研究[D];东北大学;2012年
10 王晓蕊;华北克拉通地球化学科学数据的管理及应用研究[D];中国地质大学;2008年
相关硕士学位论文 前10条
1 权西瑞;云环境下数据版权保护方法的研究[D];西安建筑科技大学;2015年
2 向兵;中药颗粒调剂设备中辅助硬件及自动封口机的设计[D];东北师范大学;2015年
3 朱跃龙;公安情报自动分类系统的设计与实现[D];电子科技大学;2015年
4 张鹏远;大数据分类存储及检索方法研究[D];西安电子科技大学;2014年
5 王梦佳;DOA下数据注册方法的初步研究与实现[D];成都理工大学;2015年
6 陈启伟;电机状态云监测系统研究与实现[D];浙江大学;2016年
7 王照清;大数据环境下数据查询优化技术应用研究[D];北方工业大学;2016年
8 贾振美;面向稀疏轨迹数据的位置预测方法研究[D];东北大学;2014年
9 雷德龙;矢量空间数据云存储与马尔可夫并行聚类算法研究[D];福州大学;2014年
10 王甜甜;国家地理大数据战略平台研究[D];中共中央党校;2016年
,本文编号:1930471
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/1930471.html