当前位置:主页 > 科技论文 > 信息工程论文 >

移动数据同步机制与真值发现算法研究

发布时间:2018-07-09 22:15

  本文选题:移动计算 + 数据同步 ; 参考:《南京邮电大学》2016年硕士论文


【摘要】:目前数据同步业务已经成为信息化时代最重要的业务之一,移动设备的多样化和性能的提高都促进了移动数据同步业务的发展。然而移动计算环境的复杂性、动态性、弱连接性以及通信延迟与带宽相对有限等特征使得移动节点间的数据同步效率降低,基于传统集中式架构的移动数据同步方案难以高效地实现数据的一致性。为了解决上述问题,本文总结了主流的数据同步技术以及同步架构,针对移动计算环境提出一种混合式数据同步机制(Hybrid Data Synchronization Mechanism,HDSM),将集中式架构和Ad hoc架构有机融合,设置自组织域(Self-Organization Domain,SOD)为同步进程管理单位,通过数据通信局域化,减少了同步数据通信量,同时减轻了数据同步服务器负载。为了缩短同步响应时间,加快SOD中同步数据的分发速度,本文还提出了一种基于节点能力值的数据分发策略(Capacity-value-based Data Distribution Strategy,CDDS),根据移动节点综合处理能力值来建立SOD树分发路径,实现了SOD中各移动节点对同步数据的高效分发。针对增量数据捕获问题,本文调研了常用的增量同步方法例如时间戳法、触发器法、日志法、快照法、API法等并提出了一种基于轨迹变更的增量捕获策略(Increment Capture Strategy based on Track Changes,ICSTC),采用触发器捕获操作日志,并用净化方法合并操作日志得到净增量数据,减少了同步数据量,降低了数据的传输成本以及缩短了同步响应时间。如今互联网已然成为了一个巨型数据集,它的发展给人们生活和工作带来便利的同时,其提供的数据质量问题也日益突出。为了确保用户搜集数据的质量,提供给用户或决策者最为准确的数据,真值发现问题受到了广泛的关注。针对现有真值发现算法复杂难懂、准确性不高的问题,本文提出了一种基于实体属性的真值发现算法(Truth Finder Algorithm based on Entity Attribute,TFAEA),在数据源可靠性和事实准确性迭代计算机制的基础上,考虑事实相互支持度和数据源之间的依赖关系两个因素,简化了真值发现算法。为了提高真值发现算法的准确性,本文采用单向文本相似度与事实冲突程度相结合的方法来计算事实相互支持度,并提出了数据源对称饱和度方法来计算数据源之间的依赖程度。实验结果表明,TFAEA算法不仅稳定,而且有很高的准确性。最后,在基于混合式数据同步机制和基于实体属性的真值发现算法基础上,设计并实现了商品比购系统,详细阐述了系统的功能架构,分模块介绍了系统的具体实现。
[Abstract]:At present, data synchronization service has become one of the most important services in the information age. The diversification of mobile devices and the improvement of performance have promoted the development of mobile data synchronization services. However, the complexity, dynamic, weak connectivity and limited communication delay and bandwidth of mobile computing environment make the efficiency of data synchronization between mobile nodes reduced. Mobile data synchronization scheme based on traditional centralized architecture is difficult to achieve data consistency efficiently. In order to solve the above problems, this paper summarizes the mainstream data synchronization technology and synchronization architecture, and proposes a hybrid data synchronization mechanism (HDSM) for mobile computing environment, which combines the centralized architecture and Ad hoc architecture. Self-Organization Domain SOD (SOD) is set as the management unit of synchronous process. Through the localization of data communication, the amount of synchronous data communication is reduced, and the load of data synchronization server is reduced at the same time. In order to shorten the synchronous response time and speed up the distribution of synchronous data in SOD, this paper also proposes a new data distribution strategy based on node capability value (Capacity-value-based data Distribution Strategy CDDS), which establishes the SOD tree distribution path according to the comprehensive processing ability of mobile nodes. The efficient distribution of synchronous data between mobile nodes in SOD is realized. Aiming at the problem of incremental data capture, this paper investigates the commonly used incremental synchronization methods such as timestamp method, trigger method, log method, etc. In this paper, an incremental capture strategy based on trajectory change (Increment capture Strategy based on track change) is proposed, which uses trigger to capture operation log, and combines operation log with purification method to obtain net increasing data, which reduces the amount of synchronous data. The data transmission cost is reduced and the synchronous response time is shortened. Nowadays the Internet has become a huge data set, its development brings convenience to people's life and work, at the same time, the problem of data quality is becoming more and more prominent. In order to ensure the quality of data collected by users and provide the most accurate data to users or decision-makers, the problem of truth-finding has been paid more and more attention. Aiming at the problem that the existing truth discovery algorithms are difficult to understand and the accuracy is not high, a truth finding Algorithm based on entity attribute algorithm (TFAEA) is proposed in this paper, which is based on the iterative computing mechanism of data source reliability and factual accuracy. Considering the fact mutual support degree and the dependence between data sources, the truth discovery algorithm is simplified. In order to improve the accuracy of the truth discovery algorithm, this paper uses the unidirectional text similarity and the fact conflict degree to calculate the fact mutual support degree. A method of data source symmetry saturation is proposed to calculate the degree of dependence between data sources. The experimental results show that the TFAEA algorithm is not only stable but also accurate. Finally, based on the mixed data synchronization mechanism and the truth-value discovery algorithm based on entity attributes, the commodity purchase system is designed and implemented. The function structure of the system is described in detail, and the implementation of the system is introduced in detail.
【学位授予单位】:南京邮电大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TN929.5

【相似文献】

相关期刊论文 前10条

1 范书国;数据同步的设计与实施[J];辽宁省交通高等专科学校学报;2004年02期

2 魏建华,佘X;嵌入式系统数据同步协议的复杂度及应用分析[J];成都信息工程学院学报;2005年04期

3 何先波,李志蜀,唐宁九,殷锋,吴云波;面向通信领域的主备倒换与数据同步技术[J];计算机应用;2005年10期

4 龙文波;;网管平台下数据同步中消息交互方法的研究[J];科学技术与工程;2007年09期

5 周书民;张天太;许志文;;嵌入式移动数据库的数据同步及其应用[J];微计算机信息;2007年14期

6 张瑛;夏克俭;张法明;蒋晨晓;;分布式异构数据库数据同步系统的研究与实现[J];小型微型计算机系统;2007年10期

7 王道才;;不同工作表数据同步走[J];电脑爱好者(普及版);2007年12期

8 师少辉;;系统整合数据同步[J];中国计算机用户;2008年40期

9 李萍;;关于分布式异构数据库数据同步系统的研究[J];电大理工;2008年01期

10 王博;李腊元;冯美来;;基于数据同步的增值业务的开发[J];计算机工程;2009年03期

相关会议论文 前5条

1 陈建雄;彭成宝;张霞;;基于事件的数据同步冲突处理[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年

2 王宇飞;许进;吕新宇;张霞;卢朝霞;;OpenBASE Mini数据同步的设计与实现[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年

3 赖建彬;;铁路客票地区中心异地迁移方案的设计与实现[A];广西计算机学会2008年年会论文集[C];2008年

4 裴海港;朱明;;智能P&ID系统中基于实体逻辑关系的数据同步方法的研究[A];计算机技术与应用进展——全国第17届计算机科学与技术应用(CACIS)学术会议论文集(下册)[C];2006年

5 郭琛;高小榕;;用于眼动检测和脑电采集的数据同步方法[A];第九届全国信息获取与处理学术会议论文集Ⅱ[C];2011年

相关重要报纸文章 前7条

1 本报记者 云杰;零售企业需要数据同步[N];计算机世界;2005年

2 ;全球数据同步困难重重[N];计算机世界;2005年

3 本报记者 周杰;全球商品数据同步助力[N];国际商报;2010年

4 北京 雨中;掌上电脑的红外数据同步[N];电脑报;2001年

5 中国人民大学信息学院 陈霞 曹会萍;保持高度一致[N];计算机世界;2001年

6 本报记者  张群英;GAMECO的选择[N];网络世界;2006年

7 ;科学家绘人类“驯化”地球图[N];大众科技报;2011年

相关硕士学位论文 前10条

1 黄辉;私有云中的数据同步、备份和恢复系统的设计与实现[D];电子科技大学;2016年

2 刘笑笑;移动数据同步机制与真值发现算法研究[D];南京邮电大学;2016年

3 林阳欧;多个业务系统间数据同步系统的设计与实现[D];华东师范大学;2009年

4 庄永耀;基于企业级移动平台的数据同步的研究与实现[D];西安电子科技大学;2012年

5 周健;数据同步技术在省级数据集中的应用[D];湖北大学;2012年

6 王志强;分布式应用中数据同步关键技术研究与应用[D];石家庄铁道大学;2013年

7 杜经纬;某企业ERP系统中数据同步软件的设计与实现[D];太原理工大学;2006年

8 蒋欣;Internet/Intranet数据同步系统[D];成都理工大学;2003年

9 周家生;分布式网络数据同步技术研究与应用[D];哈尔滨工程大学;2011年

10 陈玉林;移动设备数据同步的研究与实现[D];国防科学技术大学;2005年



本文编号:2110873

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/2110873.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户622c4***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com