基于机器学习的多维数据压缩算法研究

发布时间:2017-03-24 20:04

  本文关键词:基于机器学习的多维数据压缩算法研究,,由笔耕文化传播整理发布。


【摘要】:传统基于字典学习的视频编码系统总是忽略其信号本身的特征分布,从而导致了很高的计算复杂度,降低了编码效率。本文提出了一种基于时空在线字典学习算法()来加速字典学习的收敛速度,并保证了一定的估计误差。所述算法利用随机梯度下降法来构造三维高频与低频的时空字典对。在每次的学习迭代过程中,基于块梯度下降法学习算法优化全部训练集样本所产生的经验代价,例如。与之不同的是,随机梯度下降法随机地选择一个训练集样本,基于该样本更新字典原子最小化近似期望代价。由于训练集中的样本假设为独立同分布,稀疏表示分解系数可以通过训练字典得到。相较于算法,本文所提出的基于时空在线字典学习算法理论上可以证明有更近似的稀疏表示,并能保持视频信号的结构化稀疏以及层间稀疏性。同时,随机梯度下降法比批量梯度下降法有着更快的收敛速度以及更低的计算复杂度,其预测误差上限渐近地逼近训练误差。大量实验证明,计算复杂度的降低能够使基于时空在线字典学习的编码框架比现有基于超分辨率的编码方案以及标准编码器H.264、HEVC有着更好的客观、主观质量以及率失真表现。进一步地,利用结构化稀疏的机器学习,本文提出了一种新的基于多尺度在线字典学习算法的质量可分级视频编码框架。通过小波变换对图像特征的层次化结构进行分解,将在线学习的搜索域优化为带有层次化稀疏的区块。其中,基本层低频子带利用图像组稀疏特征来获得低频子字典以及稀疏表示系数。可以证明,所设计的跨尺度分解重构质量可由一个有上界的估计误差保证。在字典优化模块,通过随机梯度下降法直接更新期望代价而不是经验代价来降低计算复杂度。层次化的高频结构信息通过一个预先学习的子字典对来进行预测,实现可分级视频编码的目的。实验证明,所述算法能够渐进地实现质量可分级性。对于不同传输环境的异构网络,本文提出了一种基于渐进式字典学习的时间可分级视频编码框架。通过可分级帧预测结构,视频帧可以基于预先学习的时空字典连续重构得到。在所述的渐进式字典学习算法中,随着重构增强层的增加,重构视频帧提供了更多样本来优化学习字典。在实际编码中,通过直接最小化期望代价,基于随机梯度下降法的字典更新极大的降低了编码复杂度。可以证明,基于渐进式时空字典学习的可分级视频编码框架能够有效地保证视频中的运动一致性。
【关键词】:时空在线字典学习 结构化稀疏表示 渐进式字典学习 超分辨率 可分级视频编码
【学位授予单位】:上海交通大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TN919.81;TP181
【目录】:
  • 摘要5-7
  • ABSTRACT7-15
  • 主要符号对照表15-16
  • 第一章 绪论16-25
  • 1.1 引言16
  • 1.2 基于稀疏编码的超分辨率算法16-18
  • 1.3 现有的视频编码标准18-22
  • 1.3.1 混合视频编码器框架18-21
  • 1.3.2 可分级视频编码框架21-22
  • 1.4 本文主要内容与贡献22-25
  • 第二章 基于时空在线字典学习的超分辨率重建25-40
  • 2.1 研究背景25-26
  • 2.2 时空在线字典定义26-31
  • 2.2.1 问题定义26-27
  • 2.2.2 时空在线字典学习算法27-29
  • 2.2.3 时空在线字典学习的收敛速度29-31
  • 2.3 基于时空在线字典学习的超分辨率算法31-36
  • 2.3.1 基于时空在线字典学习的超分辨率算法31-32
  • 2.3.2 算法计算复杂度分析32-34
  • 2.3.3 算法预测误差分析34-36
  • 2.4 实验结果与分析36-38
  • 2.4.1 基于时空在线字典学习的合成数据表示36-37
  • 2.4.2 视频序列的字典学习效果37-38
  • 2.5 本章小结38-40
  • 第三章 基于时空在线字典学习的视频编码框架40-56
  • 3.1 研究背景40-41
  • 3.2 基于时空在线字典学习的视频编码框架41-46
  • 3.2.1 系统框架41-42
  • 3.2.2 目标函数定义42-44
  • 3.2.3 训练视频块的提取44-46
  • 3.3 基于超分辨率算法的视频帧重构46-48
  • 3.3.1 合成过程46-47
  • 3.3.2 时空在线字典的层间一致性47-48
  • 3.4 实验结果与分析48-54
  • 3.4.1 实验设置48-49
  • 3.4.2 率失真表现49-51
  • 3.4.3 主观质量51-52
  • 3.4.4 计算复杂度52-53
  • 3.4.5 关键帧的选择53-54
  • 3.5 本章小结54-56
  • 第四章 基于时空在线字典学习的可分级视频编码框架56-74
  • 4.1 研究背景56-57
  • 4.2 基于多尺度时空在线字典学习的质量可分级视频编码框架57-64
  • 4.2.1 结构化稀疏定义58-60
  • 4.2.2 层次化多尺度字典构造60-63
  • 4.2.3 跨层间重构63-64
  • 4.3 基于层次化渐进式字典学习的可分级视频编码框架64-68
  • 4.3.1 系统框架65-67
  • 4.3.2 渐进式字典学习67-68
  • 4.4 实验结果与分析68-72
  • 4.4.1 实验设置68-69
  • 4.4.2 质量可分级性69-71
  • 4.4.3 时间可分级性71-72
  • 4.5 本章小结72-74
  • 第五章 总结与展望74-77
  • 5.1 全文总结与结论74-75
  • 5.2 未来工作展望75-77
  • 参考文献77-84
  • 致谢84-86
  • 攻读学位期间发表的学术论文目录86

【相似文献】

中国期刊全文数据库 前10条

1 苏秉华,金伟其,牛丽红,刘广荣;超分辨率图像复原及其进展[J];光学技术;2001年01期

2 谭兵,徐青,耿则勋,邢帅;超分辨率图象重建技术发展现状[J];信息工程大学学报;2003年04期

3 钟山,沈振康;图像静态超分辨率重建[J];红外与毫米波学报;2004年02期

4 王勇,郑辉,胡德文;视频的超分辨率增强技术综述[J];计算机应用研究;2005年01期

5 焦斌亮;赵文蕾;;浅析互有位移图像序列的超分辨率复原[J];遥测遥控;2006年01期

6 袁建华;殷学民;邹谋炎;;一种有效的超分辨率重建计算方法[J];中国科学院研究生院学报;2006年04期

7 张地;何家忠;彭宏;;低分辨率人脸序列的超分辨率重构识别[J];韶关学院学报;2007年06期

8 梁立恒;邢立新;姜红艳;王明常;;高保真影像超分辨率重建应用研究[J];吉林大学学报(地球科学版);2007年S1期

9 郑丽贤;何小海;吴炜;杨晓敏;陈默;;基于学习的超分辨率技术[J];计算机工程;2008年05期

10 浦剑;张军平;黄华;;超分辨率算法研究综述[J];山东大学学报(工学版);2009年01期

中国重要会议论文全文数据库 前10条

1 潘明海;刘永坦;赵淑清;徐佳祥;干恒富;;一种多运动目标的超分辨率检测算法[A];第九届全国信号处理学术年会(CCSP-99)论文集[C];1999年

2 李兵兵;陆耀;王晓明;李劲娴;;基于金字塔回归策略的人脸超分辨率[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年

3 戴光智;陈铁群;薛家祥;;基于微扫描技术焊缝超声图像的超分辨率重建[A];第十七届全国测控计量仪器仪表学术年会(MCMI'2007)论文集(上册)[C];2007年

4 郑杰;韩梅;;基于微位移的超分辨率重建技术[A];2008'中国信息技术与应用学术论坛论文集(一)[C];2008年

5 张光昭;胡敬炉;谢泽明;;超分辨率亚毫米波付里叶变换谱[A];第四届全国波谱学学术会议论文摘要集[C];1986年

6 缪泓;徐海明;;微平移序列图像的超分辨率重建技术[A];中国力学学会学术大会'2009论文摘要集[C];2009年

7 徐启飞;颜刚;陈武凡;;关于序列图像的超分辨率重建算法[A];中国生物医学工程进展——2007中国生物医学工程联合学术年会论文集(上册)[C];2007年

8 徐忠强;朱秀昌;;基于正则算法的压缩视频超分辨率重建[A];第十三届全国图象图形学学术会议论文集[C];2006年

9 池小梅;马建伟;黄景涛;;基于压缩传感的超分辨率红外成像研究[A];中国自动化学会中南六省(区)2010年第28届年会·论文集[C];2010年

10 黄华;何惠婷;;一种基于CCA空间超分辨率的人脸识别方法[A];第18届全国多媒体学术会议(NCMT2009)、第5届全国人机交互学术会议(CHCI2009)、第5届全国普适计算学术会议(PCC2009)论文集[C];2009年

中国博士学位论文全文数据库 前10条

1 傅罡;多源遥感数据的道路提取方法研究[D];清华大学;2014年

2 巴拉卡,雅各布Maiseli(Baraka Jacob Maiseli);基于正则化的非线性扩散模型的超分辨率方法[D];哈尔滨工业大学;2015年

3 王晓峰;基于样本学习的人脸超分辨率重建技术研究[D];华中科技大学;2015年

4 袁建华;超分辨率重建中若干问题的研究[D];中国科学院研究生院(电子学研究所);2006年

5 范冲;三线阵影像超分辨率重建[D];中南大学;2007年

6 张小红;视频去运动模糊及超分辨率研究[D];浙江大学;2012年

7 江涛;同视域多帧视觉影像超分辨率重建技术研究[D];山东科技大学;2005年

8 郭晓新;超分辨率重建问题的研究[D];吉林大学;2005年

9 韩玉兵;图像及视频序列的超分辨率重建[D];东南大学;2006年

10 卢涛;低质量监控视频人脸超分辨率技术研究[D];武汉大学;2013年

中国硕士学位论文全文数据库 前10条

1 李智盛;压缩传感在超分辨率中的应用[D];清华大学;2011年

2 刘鹏;压缩自编码字典下的多机制邻域嵌入超分辨率重建算法[D];华南理工大学;2015年

3 蒋晓慧;自适应正则化超分辨率重建方法的研究[D];苏州大学;2015年

4 杨国珂;基于压缩传感的图像分辨率重构方法和应用[D];江西理工大学;2015年

5 周才发;基于流形对齐的WLAN室内定位方法研究[D];哈尔滨工业大学;2015年

6 陈果;单一医学视频时空超分辨率算法研究[D];北京理工大学;2015年

7 李靖;基于压缩感知的超分辨率理论与技术研究[D];电子科技大学;2015年

8 黎媛;基于超分辨率的多视角混合分辨率视频描述的关键技术研究[D];电子科技大学;2015年

9 罗国中;面向低质量视频的目标对象的超分辨率重建技术研究[D];国防科学技术大学;2013年

10 李华阳;手部深度图像去噪与超分辨率方法研究[D];北京工业大学;2015年


  本文关键词:基于机器学习的多维数据压缩算法研究,由笔耕文化传播整理发布。



本文编号:266081

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/266081.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户4919c***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com