集成数据中的完整性约束问题研究
本文关键词:集成数据中的完整性约束问题研究
更多相关文章: 信息集成 完整性约束 约束分解 启发式修复 一致性查询
【摘要】:信息集成旨在为用户访问多个异构的信息源提供统一的全局视图,屏蔽数据来源,克服异构性和数据冲突,从而对应用所需要数据提供透明访问支持。所谓异构性包括所用数据模型、数据管理系统技术差异及逻辑异构,其中逻辑异构又包括模式差异和语义差异。完整性约束为数据库中数据提供与外部现实保持语义一致的途径。在传统数据库(包括理想分布式数据库)中,完整性约束保证当授权用户对数据库进行修改时不会破坏数据的一致性。即当应用试图通过含有INSERT、DELETE和UPDATE语句的更新事务对数据库状态进行变迁时,DBMS将对可能产生的新状态按照给定的完整性约束进行检验,并抵制那些导致完整性约束被破坏的事务发生。为保证应用通过集成系统所获取数据的有效性,同样需要对以全局模式描述的集成数据库施以必要完整性约束。由于集成数据库只是相关信息源数据的整合与融合,信息源系统的自治性和大规模数据集成导致的系统复杂性都不允许集成数据库的完整性维护能像对理想分布式数据库那样通过对信息源更新事务的全局完整性检验来实现;同时,这也并无必要。从原则上说,对集成数据库的完整性维护只需保证从它进行查询所获得的结果都满足这些约束。以往在数据仓库(本质是是一种实体化集成)背景以数据质量保障为题发展的数据清洗,以及后来面向虚拟集成所发展的一致性查询都可看成是服务于这一目标在不同集成方式下采取的实现手段。问题是所有这些技术都是基于对查询本身给出的约束进行检验和修复。(注意到实体化集成可看作对查询结果的实体化存储)。这对于虚拟集成以及虚拟和实体化相结合的集成远未解决问题。首先是如何产生对查询的约束?其次是如何对完整性检验及数据修复的任务在信息集成系统的各构件之间进行合理分配?针对这些问题,本文研究包括如下两方面:(1)为提高集成系统对全局端完整性约束处理的效率,可将完整性约束维护任务在集成端和各信息源适配器之间进行合理负载分配,即将全局完整性约束处理分解为各局部模式的完整性维护及集成端数据冲突消解。为此本文基于约束分解的思想,探讨从全局模式到局部模式之间的约束传播问题。(2)为了解决集成过程中出现的数据不一致的情形,提出新的修复算法。提出基于启发式的修复算法,对全局端来源于不同局部模式间的数据不一致的情形进行修复。(3)通过在集成系统中部署相应的实现,验证完整性约束的实施过程,对本文提出的约束分解和修复算法进行了实现和应用。
【关键词】:信息集成 完整性约束 约束分解 启发式修复 一致性查询
【学位授予单位】:暨南大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP311.13
【目录】:
- 摘要3-5
- Abstract5-9
- 第一章 绪论9-23
- 1.1 研究背景9-13
- 1.2 国内外研究现状13-17
- 1.3 研究内容17-19
- 1.4 主要贡献19-20
- 1.5 课题来源20-21
- 1.6 论文结构安排21-23
- 第二章 全局模式到局部模式的约束传播23-45
- 2.1 完整性约束23-26
- 2.2 集成系统的完整性约束问题26-29
- 2.2.1 问题引出26-27
- 2.2.2 维护任务分配27-29
- 2.3 约束分解29-31
- 2.4 基本关系代数的约束保持性定理及其证明31-40
- 2.5 导出关系约束传播40-43
- 2.5.1 约束分解算法40-43
- 2.5.2 算法正确性及复杂度分析43
- 2.6 本章小结43-45
- 第三章 基于启发式修复的一致性查询45-65
- 3.1 修复语义45-46
- 3.2 问题分析46-50
- 3.3 相关定义50-52
- 3.3.1 基本定义51
- 3.3.2 基本启发式51-52
- 3.4 相关计算52-55
- 3.4.1 信息源的可靠性和事实的可信度52-54
- 3.4.2 通过矩阵运算来计算信息源的可靠性和事实的可信度54-55
- 3.5 迭代算法55-57
- 3.5.1 算法思想及迭代过程55-56
- 3.5.2 算法复杂度分析56-57
- 3.6 修复算法57-59
- 3.6.1 函数依赖修复算法57
- 3.6.2 包含依赖修复算法57-58
- 3.6.3 修复算法正确性及复杂度分析58-59
- 3.7 实验分析59-64
- 3.8 本章小结64-65
- 第四章 完整性约束处理的设计与实现65-84
- 4.1 一致性查询65-66
- 4.2 查询重写66-68
- 4.3 完整性约束的实施过程68-72
- 4.4 完整性约束处理的设计72-83
- 4.4.1 约束分解72-73
- 4.4.2 约束合并73-77
- 4.4.3 局部一致性修复77-78
- 4.4.4 全局一致性修复78-79
- 4.4.5 带有完整性约束的执行计划79-83
- 4.5 本章小结83-84
- 第五章 总结和展望84-87
- 5.1 总结84-86
- 5.2 展望86-87
- 参考文献87-94
- 在校期间发表论文及科研成果清单94-95
- 致谢95
【相似文献】
中国期刊全文数据库 前10条
1 姜跃平;董继润;;完整性约束规则的自动生成[J];计算机科学;1994年04期
2 王哲;;数据库中完整性约束的教学方法探究[J];中国科教创新导刊;2013年35期
3 张凡;熊志平;胡运发;;存在完整性约束时最小化树模式查询的算法[J];计算机工程;2006年10期
4 朱三元;朱福喜;魏文才;;一种不协调数据库中有效查询的方法[J];计算机工程与应用;2007年27期
5 黄慧;毛宇光;;基于时区的次协调数据库的完整性约束及模型[J];计算机应用与软件;2014年03期
6 常新功;VFP完整性机制探析[J];微机发展;2002年03期
7 佟玉军,陈文实,贾丹;浅析VFP完整性机制[J];锦州师范学院学报(自然科学版);2003年02期
8 赫然,王秀坤,王轶讴,曾智;分布式数据库中海量数据采集完整性约束[J];大连理工大学学报;2003年S1期
9 程红梅;关系模型的数据库结构与完整性约束[J];电脑知识与技术;2003年26期
10 熊小华;黄明和;宁爱兵;;数据编辑界面中数据自动校验的设计与实现[J];江西师范大学学报(自然科学版);2007年02期
中国重要会议论文全文数据库 前8条
1 郭迎春;李红燕;;一个保持完整性约束的查询转化机制[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
2 宋豪;郑振楣;石树刚;;用完整性约束条件获取关系查询的语义[A];第九届全国数据库学术会议论文集(上)[C];1990年
3 张志强;郭奇;冯建华;周立柱;;一种保持完整性约束的集成方法[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
4 刘希安;;dBASE完整性的实现方法[A];第九届全国数据库学术会议论文集(下)[C];1990年
5 李红燕;邓江;李战怀;;一个ORDBMS对引用语义的支持[A];第十六届全国数据库学术会议论文集[C];1999年
6 向阳;李战怀;李红燕;邓江;;ANGEL-Ⅱ的完整性约束的设计与实现[A];第十五届全国数据库学术会议论文集[C];1998年
7 张鹏;朱鸿隽;王珊;;COBASE系统中完整性约束的实现[A];第十二届全国数据库学术会议论文集[C];1994年
8 熊伟;张巨;景宁;;从空间完整性约束导出触发器ECA规则[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
中国博士学位论文全文数据库 前3条
1 星芸鹏;资源空间模型的完整性约束理论[D];中国科学院研究生院(计算技术研究所);2004年
2 崔仙姬;OWL本体中完整性约束的验证方法研究[D];吉林大学;2014年
3 谈子敬;XML的完整性约束[D];复旦大学;2003年
中国硕士学位论文全文数据库 前6条
1 黎章海;集成数据中的完整性约束问题研究[D];暨南大学;2016年
2 崔仙姬;完整性约束本体到关系数据库的映射[D];吉林大学;2011年
3 李燕;基于关系模式的带完整性约束的数据集成研究[D];燕山大学;2007年
4 邓亚丹;GKD-Base完整性约束的研究与实现[D];国防科学技术大学;2005年
5 常晓娟;XML文档完整性约束中关键问题的研究[D];哈尔滨工程大学;2008年
6 邬丽云;XML数据管理技术研究[D];南京航空航天大学;2004年
,本文编号:1115555
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1115555.html