当前位置:主页 > 科技论文 > 软件论文 >

海量视频共享系统中基于溯源的数据减缩方法

发布时间:2018-07-26 06:22
【摘要】:随着视频共享系统和编辑软件的出现以及广泛使用,共享系统中的视频数量和种类快速增加。在这些海量视频中存在大量重复或在内容上高度近似的视频,增加了用户与视频共享系统之间的网络带宽消耗。视频的访问热度分布服从帕勒托分布,少数热门视频占据绝大部分访问量,而大量冷视频的访问量很少或是没人访问。共享系统中不能发生用户数据丢失,导致大量冷数据的长期存储累积开销会非常可观。如何有效地减少近似视频上传带宽消耗,保证视频数据不丢失的前提下实现冷视频数据空间减缩来节省系统整体开销且不对用户的访问造成过多影响成了一个挑战。设计了一种在海量视频共享系统中基于溯源的数据减缩方法—Dpbvd,对系统中已有视频进行编辑时,通过将视频的编辑操作转移到服务器上,避免视频的上传,从而节省带宽。同时又缩减系统中具有溯源信息的冷门近似视频数据来降低服务器整体管理开销。数据减缩方法是指重复数据删除和近似冗余数据压缩。在客户端,用户编辑视频时收集相关的编辑操作信息和视频信息作为新生成视频的应用层溯源信息,并上传至服务器。在服务器端,系统记录每一个阶段内视频的访问次数以及自上传后的累积访问次数,综合考虑视频的访问热度趋势和近期访问次数来动态预测视频的冷热程度;缓存热度高的视频,降低访问时延;对于冷视频,保留不具有溯源信息的冷视频。通过扫描收集的溯源信息,找到具有溯源信息的冷门视频而将其压缩而节省存储开销,具有溯源信息的视频压缩后可根据溯源信息而重新生成,从而系统不会发生数据丢失。试验测试表明,海量视频共享系统中基于溯源的数据减缩方法能够有效节省共享系统视频存储空间,且冷热视频预测精确度高,不会显著影响用户访问视频的速度。
[Abstract]:With the emergence and wide use of video sharing systems and editing software, the number and types of video in sharing systems are increasing rapidly. There are a large number of repetitive or highly similar videos in these massive videos, which increase the network bandwidth consumption between users and video sharing systems. The frequency of video access is distributed from Paleto, with a few popular videos accounting for most of the traffic, while a large number of cold videos have little or no access. There is no loss of user data in the shared system, which leads to a large amount of cold data long-term storage accumulation costs will be very considerable. It is a challenge how to reduce the bandwidth consumption of approximate video uploads effectively and realize the reduction of cold video data space without losing video data so as to save the overall cost of the system and not affect the users' access too much. A traceability based data reduction method-Dpbvd- based on traceability in a mass video sharing system is designed. When the existing video in the system is edited, the editing operation of the video is transferred to the server to avoid the uploading of the video and thus the bandwidth is saved. At the same time, the cold door approximate video data with traceability information in the system is reduced to reduce the overall management overhead of the server. Data reduction refers to repetitive data deletion and approximate redundant data compression. On the client side, the user collects the relevant editing operation information and video information as the application layer information of the newly generated video, and uploads it to the server. On the server side, the system records the number of video access and the cumulative number of visits since uploading, synthetically considering the trend of access heat and the number of recent visits to dynamically predict the cold and hot degree of video. Cache high temperature video, reduce access delay; for cold video, keep cold video without traceability information. By scanning the collected traceability information, we can find the cold-door video with traceability information and compress it to save storage overhead. The video with traceability information can be regenerated according to the traceability information, so that data loss will not occur in the system. The experimental results show that the traceability based data reduction method in mass video sharing system can effectively save the storage space of video in the shared system, and the accuracy of cold and hot video prediction is high, and the speed of users accessing video will not be significantly affected.
【学位授予单位】:华中科技大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP311.52

【相似文献】

相关期刊论文 前10条

1 杨红爵;;略论数据空间[J];成功(教育);2009年01期

2 郭莹;;数据空间关键问题探究[J];软件导刊;2012年07期

3 厉剑;张绍雄;刘俊杰;李成柱;;大数据引发信息时代新变革[J];大众科技;2013年12期

4 李斌;;大数据及其发展趋势研究[J];广西教育;2013年35期

5 张晓军;孟祥武;;数字化周期[J];计算机科学;2002年05期

6 崔晨;吴扬扬;;基于活动的数据空间数据关系发现[J];微型机与应用;2011年11期

7 贾云得;;微型数字存贮遥测装置数据预存贮方法[J];遥测遥控;1989年06期

8 靳小龙;王元卓;程学旗;;大数据的研究体系与现状[J];信息通信技术;2013年06期

9 朝乐门;;数据空间及其信息资源管理视角研究[J];情报理论与实践;2013年11期

10 黄一凡;;合并分区 数据无损有妙招[J];电脑爱好者;2011年23期

相关会议论文 前5条

1 李鸿奎;陈洪艳;;大连市房地产基础地理信息系统的设计和建设[A];中国地理信息系统协会第九届年会论文集[C];2005年

2 董彦磊;申德荣;寇月;聂铁铮;;数据空间中数据组织模型以及关联关系发现模型的研究[A];第26届中国数据库学术会议论文集(B辑)[C];2009年

3 庞怡;许洪光;张志敏;;针对海量科技信息的存储研究[A];信息时代——科技情报研究学术论文集(第三辑)[C];2008年

4 季承;;Oracle利用HWM高水标记收缩数据空间方案[A];2013电力行业信息化年会论文集[C];2013年

5 季承;;Oracle利用HWM高水标记收缩数据空间方案[A];2013电力行业信息化年会论文集[C];2013年

相关重要报纸文章 前6条

1 牛泽亚;用户如何在数据空间里“被遗忘”?[N];人民邮电;2014年

2 风格;指引大数据未来发展方向的九大真理[N];中华读书报;2013年

3 录音整理 本报记者 刘文强 杨丰源;创新驱动,奋力奔向大数据时代[N];贵阳日报;2014年

4 中国人民大学信息学院 李玉坤;云计算与数据空间[N];中国计算机报;2008年

5 整理 本报记者 苏丹丹;把握大数据机遇 推动文化产业跨越发展[N];中国文化报;2013年

6 安徽国税局 赵为民;税务综合数据平台的设想[N];计算机世界;2007年

相关博士学位论文 前10条

1 李晓娜;面向SaaS应用的多租户数据放置机制研究[D];山东大学;2015年

2 张德兵;基于机器学习的数据补全、标注和检索若干问题研究[D];浙江大学;2015年

3 刘思彤;空间文本数据的查询处理技术研究[D];清华大学;2015年

4 侯振隆;重力全张量梯度数据的并行反演算法研究及应用[D];吉林大学;2016年

5 柯余洋;面向三类应用数据的智能分析与优化研究[D];中国科学技术大学;2016年

6 刘正涛;构建Web数据空间的若干关键技术研究[D];南京航空航天大学;2016年

7 姜朔;数据空间中数据集成若干关键问题研究[D];东华大学;2014年

8 祝官文;数据空间集成与查询关键技术研究[D];哈尔滨工程大学;2016年

9 陈鹏;面向情景感知计算的时空数据管理、查询、分析与相关算法研究[D];华东师范大学;2013年

10 杨丹;数据空间中基于语义的实体搜索关键技术研究[D];东北大学;2012年

相关硕士学位论文 前10条

1 权西瑞;云环境下数据版权保护方法的研究[D];西安建筑科技大学;2015年

2 向兵;中药颗粒调剂设备中辅助硬件及自动封口机的设计[D];东北师范大学;2015年

3 朱跃龙;公安情报自动分类系统的设计与实现[D];电子科技大学;2015年

4 张鹏远;大数据分类存储及检索方法研究[D];西安电子科技大学;2014年

5 王梦佳;DOA下数据注册方法的初步研究与实现[D];成都理工大学;2015年

6 王照清;大数据环境下数据查询优化技术应用研究[D];北方工业大学;2016年

7 贾振美;面向稀疏轨迹数据的位置预测方法研究[D];东北大学;2014年

8 雷德龙;矢量空间数据云存储与马尔可夫并行聚类算法研究[D];福州大学;2014年

9 王甜甜;国家地理大数据战略平台研究[D];中共中央党校;2016年

10 周跃龙;面向微博客的数据可视化设计与实现[D];电子科技大学;2016年



本文编号:2145141

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2145141.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户0af9b***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com