当前位置:主页 > 科技论文 > 计算机论文 >

基于回归检测的滑动块重复数据删除算法

发布时间:2018-03-07 12:46

  本文选题:云存储 切入点:回归检测 出处:《新疆大学学报(自然科学版)》2017年03期  论文类型:期刊论文


【摘要】:随着大数据时代的来临,重复数据在存储系统中占有很高比例,如何在保障数据可用性的前提下提高存储系统利用率问题一直是研究人员关注的热点.重复数据删除技术是一种存储系统优化技术,通过比较数据指纹确定冗余并删除,达到保障数据唯一性的目的.在重复数据分块检测过程中,无匹配指纹的块即认定为新数据存储,然而通过研究发现,未匹配块中仍然包含大量的重复数据,若能检测到未匹配块内的重复数据,则能够在一定程度上进一步提高重复数据检测率.本文提出一种基于回归检测的滑动块重复数据删除算法,对传统滑动块技术产生的未匹配数据块进行回归检测,通过对比未匹配块的结构变化进而确定数据操作类型,再根据不同的操作类型执行不同的检测算法,达到去除未匹配块内重复数据的目的.实验表明:本算法在时间开销方面比较合理,并能够有效提高重复数据检测率.
[Abstract]:With the advent of big data's time, duplicate data occupy a high proportion in the storage system. How to improve the utilization rate of storage system under the premise of ensuring the availability of data has always been the focus of attention of researchers. Repeated data deletion is a storage system optimization technology, which determines redundancy and deletes by comparing data fingerprints. In the process of repeated data block detection, the block without matching fingerprint is considered as the new data storage. However, it is found that the unmatched block still contains a large number of repeated data. If the repeated data in the unmatched block can be detected, the detection rate of repeated data can be further improved to a certain extent. In this paper, a sliding block repeat data deletion algorithm based on regression detection is proposed. The unmatched data blocks produced by the traditional sliding block technology are detected by regression. By comparing the structure changes of the unmatched blocks, the data operation types are determined, and different detection algorithms are executed according to the different operation types. The experimental results show that the proposed algorithm is reasonable in time cost and can effectively improve the detection rate of repeated data.
【作者单位】: 新疆大学软件学院;新疆大学信息科学与工程学院;
【基金】:国家自然科学基金项目(61462079) 新疆维吾尔自治区高校科研计划(XJEDU2016S106)
【分类号】:TP301.6;TP333

【参考文献】

相关期刊论文 前2条

1 付印金;肖侬;刘芳;;重复数据删除关键技术研究进展[J];计算机研究与发展;2012年01期

2 敖莉;舒继武;李明强;;重复数据删除技术[J];软件学报;2010年05期

【共引文献】

相关期刊论文 前10条

1 卞琛;于炯;修位蓉;;基于回归检测的滑动块重复数据删除算法[J];新疆大学学报(自然科学版);2017年03期

2 张曙光;咸鹤群;刘红燕;侯瑞涛;;云存储环境中基于离线密钥传递的加密重复数据删除方法研究[J];信息网络安全;2017年07期

3 刘瑞锴;邓玉辉;;内存过载下基于重删的内存优化策略[J];小型微型计算机系统;2017年06期

4 钱磊;原昊;赵锦明;李祥;吴东;谢向辉;;基于蚁群平台的智能存储技术及应用[J];计算机工程与设计;2017年05期

5 胡竟伟;吴迪;刘娜;;链路层光纤网络被动数据存储方法研究[J];内蒙古师范大学学报(自然科学汉文版);2017年03期

6 朱江;冀鸣;杨志成;张嘉贤;曹雄;;基于重复数据删除技术的存储系统分析[J];信息系统工程;2017年04期

7 吴彦虹;;集中式数据备份系统研究[J];网络安全技术与应用;2017年04期

8 王闪;谭良;;Web大数据环境下的相似重复数据清理[J];计算机工程与设计;2017年03期

9 邓仲华;黄雅婷;;“互联网+”环境下我国科学数据共享平台发展研究[J];情报理论与实践;2017年02期

10 齐来军;周丽娟;任仲山;;医学影像云存储模型的研究与设计[J];计算机应用与软件;2017年02期

【二级参考文献】

相关期刊论文 前1条

1 敖莉;舒继武;李明强;;重复数据删除技术[J];软件学报;2010年05期

【相似文献】

相关期刊论文 前10条

1 ;重复数据删除可实现25:1压缩[J];每周电脑报;2007年01期

2 贾志凯;王树鹏;陈光达;彭成;;一种并行层次化的重复数据删除技术[J];计算机研究与发展;2011年S1期

3 Eric Bassier;;应对数据增长的重磅武器——重复数据删除技术[J];计算机与网络;2013年06期

4 于丹;;昆腾进入重复数据删除市场[J];每周电脑报;2007年09期

5 卢敏;;“零距离”重复数据删除[J];软件世界;2008年11期

6 卢敏;;点亮“重复数据删除”[J];软件世界;2008年06期

7 徐立洋;;选购重复数据删除方案 软硬兼施剔除鸡肋数据[J];中国计算机用户;2009年08期

8 邢延刚;;删除重复值我有妙法[J];电脑迷;2009年09期

9 李刚;;重复数据删除走向“源头”[J];中国计算机用户;2009年16期

10 雷赫;;重复数据删除技术方案选型 删除冗余 优化存储[J];中国计算机用户;2009年23期

相关会议论文 前3条

1 贾志凯;王树鹏;陈光达;彭成;;一种并行层次化的重复数据删除技术[A];2010年第16届全国信息存储技术大会(IST2010)论文集[C];2010年

2 杨廷梧;;基于重复数据删除的靶场试验信息存储技术[A];2009年西部光子学学术会议论文摘要集[C];2009年

3 肖钧;黄亮;;虚拟化搭配去重,双剑合璧更给力[A];2011年CAD/CAM学术交流会议论文集[C];2011年

相关重要报纸文章 前10条

1 本报记者 张伟;重复数据删除能被扶正吗[N];中国计算机报;2008年

2 王琨月;重复数据删除不该忽视弱点[N];网络世界;2008年

3 本报记者 郭涛;基于硬件的重复数据删除效率更高[N];中国计算机报;2009年

4 朱皎;重复数据删除技术渐成主流[N];电脑商报;2009年

5 邢小萍;重复数据删除技术渐入佳境[N];网络世界;2009年

6 本报记者 刑小萍;重复数据删除市场迎来开门红[N];网络世界;2010年

7 清水 编译;部署重复数据删除[N];计算机世界;2010年

8 编译 张磊;谁在拖重复数据删除的后腿[N];中国计算机报;2009年

9 本报记者 郭涛;重复数据删除2.0追求“双高”[N];中国计算机报;2012年

10 编译 沈建苗;你果真需要重复数据删除技术吗[N];计算机世界;2013年

相关博士学位论文 前10条

1 林彬;主存储服务系统中高I/O性能的重复数据删除技术研究[D];国防科学技术大学;2014年

2 周炳;海量数据的重复数据删除中元数据管理关键技术研究[D];清华大学;2015年

3 周景才;云数据中心软件节能关键技术的研究[D];武汉大学;2016年

4 王国华;高效重复数据删除技术研究[D];华南理工大学;2014年

5 王灿;基于在线重复数据消除的海量数据处理关键技术研究[D];电子科技大学;2012年

6 付印金;面向云环境的重复数据删除关键技术研究[D];国防科学技术大学;2013年

7 周正达;信息存储系统中重复数据删除技术的研究[D];华中科技大学;2012年

8 杨天明;网络备份中重复数据删除技术研究[D];华中科技大学;2010年

9 朱锐;重复数据删除技术中的并行性能优化算法研究[D];华中科技大学;2013年

10 阎芳;重复数据删除系统数据组织研究[D];北京理工大学;2015年

相关硕士学位论文 前10条

1 张明月;客户端加密重复数据删除机制的研究[D];西安电子科技大学;2014年

2 黄可;重复数据可删除的云数据审计协议的研究[D];电子科技大学;2015年

3 王振宇;安全云存储中重复数据删除机制研究[D];南京邮电大学;2015年

4 李志然;云存储中集群重复数据删除系统的研究与设计[D];东北大学;2014年

5 张宏亮;重复数据删除技术在云存储中的应用与实现[D];华中科技大学;2014年

6 曹秀秀;面向XML相似性重复数据的清洗方法研究[D];首都经济贸易大学;2016年

7 彭健;基于重复数据删除的教育资源管理系统设计与实现[D];电子科技大学;2016年

8 陈琳;基于存储系统的重复数据删除技术的研究[D];南京邮电大学;2016年

9 涂群;云存储系统中重复数据删除机制的研究[D];南京邮电大学;2016年

10 曲新奎;云存储中数据编码优化和重复数据删除技术研究[D];东北大学;2013年



本文编号:1579354

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/1579354.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户66115***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com