当前位置:主页 > 科技论文 > 软件论文 >

基于迁移鲁棒稀疏编码的图像表示方法

发布时间:2019-03-19 19:04
【摘要】:图像表示是图像处理和图像理解研究中的关键问题之一.在图像的低层表示上有很多重要的研究工作,例如HOG,SIFT等.然而在图像的低层表示和高层语义间仍然存在着巨大的鸿沟.因而,很多机器学习的方法被用来学习图像的高层表示,例如主成分分析,稀疏编码,非负矩阵分解以及低秩表示等.传统机器学习假设标记图像和未标记图像服从同一分布,图像表示的误差服从高斯分布.然而现实中图像数据更新速度快,而且图像生成环境存在差异性,导致未标记图像与已标记图像不服从同一分布,因而需要重新标记数据和训练模型.并且图像数据容易出现异常,例如遮挡、腐蚀等等,从而不能再用高斯分布来估计误差.迁移学习允许标记图像(训练数据)和未标记图像(测试数据)服从不同的分布.基于迁移学习的图像表示方法学习一个新的好的特征空间.在这个新的特征空间下,可以较好地描述标记图像和未标记图像的语义信息.并且在这个新的特征空间下,从训练集中标记图像上学习到的统计模型(例如分类模型),可以较好地迁移到测试集中未标记图像上,从而充分利用已标记图像,将学习到的知识迁移到未标记的图像集上.该文提出了一种基于迁移鲁棒稀疏编码的图像表示方法,引入权值矩阵削弱异常点对分类的干扰,使用稀疏编码获得数据的高级语义,利用最小化最大均值差异缩小源域和目标域图像集之间的分布差异以及图拉普拉斯项保留图像集的几何特性.该文的主要贡献在于:一是通过权值矩阵泛化残差分布,使得所提出的基于迁移鲁棒稀疏编码的图像表示方法能大大减少异常点对编码和字典学习的影响;二是在鲁棒字典学习过程中,采用正则化参数代替迁移稀疏编码中的字典约束,从而将其转化为无约束优化问题,避免了拉格朗日求解法的复杂性.在几个通用迁移学习数据集上的对比实验结果表明,该文所提出的图像表示方法在分类上的平均准确率比其它6种相关主流方法均有不同程度的提高,证明了其有效性和鲁棒性.
[Abstract]:Image representation is one of the key issues in image processing and image understanding. There are many important research work on the low-level representation of images, such as HOG,SIFT. However, there is still a huge gap between the low-level representation and the high-level semantics of the image. Therefore, many machine learning methods are used to study high-level representation of images, such as principal component analysis, sparse coding, non-negative matrix decomposition and low-rank representation. Traditional machine learning assumes that marked image and unmarked image obey the same distribution, and the error of image representation follows Gao Si distribution. However, in reality, the updating speed of image data is fast, and there are differences in the environment of image generation, which results in the disobedience of unmarked image and marked image to the same distribution, so it is necessary to re-label the data and training model. And the image data are easy to appear abnormal, such as occlusion, corrosion and so on, so Gao Si distribution can no longer be used to estimate the error. Migration learning allows marked images (training data) and untagged images (test data) to follow different distributions. Image representation method based on migration learning to learn a new good feature space. In this new feature space, the semantic information of marked image and unmarked image can be well described. And in this new feature space, statistical models (such as classification models) learned from marked images in training sets can be well migrated to untagged images in test sets, thus making full use of tagged images. Migrate the learned knowledge to an untagged set of images. In this paper, an image representation method based on migration robust sparse coding is proposed. The weight matrix is introduced to weaken the interference of outliers on the classification, and the sparse coding is used to obtain the high level semantics of the data. The distribution difference between the source domain and the target domain is reduced by minimizing the maximum mean difference, and the geometric properties of the image set reserved by the Tulapulas term are also reduced. The main contributions of this paper are as follows: firstly, the residual distribution is generalized by weight matrix, so that the proposed image representation method based on migration robust sparse coding can greatly reduce the influence of outliers on coding and dictionary learning; Second, in the process of robust dictionary learning, regularization parameters are used to replace dictionary constraints in migration sparse coding, which is transformed into an unconstrained optimization problem, thus avoiding the complexity of Lagrangian solution. The experimental results on several general transfer learning data sets show that the average classification accuracy of the proposed image representation method is higher than that of the other six mainstream methods to some extent. Its effectiveness and robustness are proved.
【作者单位】: 安徽大学计算智能与信号处理教育部重点实验室;安徽大学计算机科学与技术学院;
【基金】:国家自然科学基金(61602004,61472001) 安徽省高校自然科学研究重点项目(KJ2016A041) 安徽省自然科学基金(1408085MF122,1508085MF127) 安徽大学信息保障技术协同创新中心公开招标课题(ADXXBZ2014-5,ADXXBZ2014-6)资助~~
【分类号】:TP391.41

【相似文献】

相关期刊论文 前10条

1 孙俊,王文渊,卓晴;基于稀疏编码的提取人脸整体特征算法[J];清华大学学报(自然科学版);2002年03期

2 晁永国;戴芳;韩舒然;何静;;改进的非负稀疏编码图像基学习算法[J];计算机工程与科学;2010年01期

3 谢尧芳;苏松志;李绍滋;;基于稀疏编码的迁移学习及其在行人检测中的应用[J];厦门大学学报(自然科学版);2010年02期

4 郎利影;夏飞佳;;人脸识别中的零范数稀疏编码[J];应用科学学报;2012年03期

5 程东阳;蒋兴浩;孙锬锋;;基于稀疏编码和多核学习的图像分类算法[J];上海交通大学学报;2012年11期

6 邹柏贤;苗军;;自然图像稀疏编码模型研究综述[J];郑州大学学报(工学版);2013年03期

7 刘伟锋;刘红丽;王延江;;基于多分离部件稀疏编码的人脸图像分析[J];模式识别与人工智能;2013年11期

8 张抒;蔡勇;解梅;;基于局部区域稀疏编码的人脸检测[J];软件学报;2013年11期

9 单桂军;廖建锋;;最大似然稀疏编码在人脸识别中的研究[J];电视技术;2013年23期

10 王瑞霞;彭国华;郑红婵;;拉普拉斯稀疏编码的图像检索算法[J];计算机科学;2014年08期

相关会议论文 前3条

1 尚丽;;使用正态可逆高斯密度模型的非负稀疏编码收缩技术实现图像消噪[A];苏州市自然科学优秀学术论文汇编(2008-2009)[C];2010年

2 于万波;赵庆贤;易欣;;基于神经网的图像表示方法[A];中国图象图形学会第十届全国图像图形学术会议(CIG’2001)和第一届全国虚拟现实技术研讨会(CVR’2001)论文集[C];2001年

3 刘扬;程健;卢汉清;;基于目标局部特征的迁移式学习[A];第十四届全国图象图形学学术会议论文集[C];2008年

相关博士学位论文 前10条

1 孙宇平;基于稀疏表征和自相似性的视觉数据识别关键技术及应用[D];华南理工大学;2015年

2 吕京磊;基于功能磁共振成像的大脑架构表达的研究[D];西北工业大学;2016年

3 王婧;面向在线环境的数据编码问题研究[D];合肥工业大学;2015年

4 李清勇;视觉感知的稀疏编码理论及其应用研究[D];中国科学院研究生院(计算技术研究所);2006年

5 季昊;稀疏编码研究及其在模式识别中的应用[D];北京邮电大学;2012年

6 江波;基于图理论与稀疏约束模型的图像表示、匹配与识别[D];安徽大学;2015年

7 谢凌曦;基于局部特征的图像表示模型理论与实践[D];清华大学;2015年

8 朱杰;基于颜色词袋模型的图像表示方式[D];北京交通大学;2016年

9 杨政;基于带约束矩阵的图像表示与检索算法研究[D];浙江大学;2016年

10 张键;面向人脸识别的图像表示和分类研究[D];南京理工大学;2015年

相关硕士学位论文 前10条

1 柏文强;基于局部特征提取和稀疏编码的人脸识别算法研究[D];燕山大学;2015年

2 李明;目标检测与识别算法研究与应用[D];中央民族大学;2015年

3 许涛;面向视频管理的指纹特征提取技术研究[D];电子科技大学;2015年

4 谢易道;大规模人脸图像编码及其在人脸验证中的应用研究[D];电子科技大学;2015年

5 勾珍珍;基于空间约束和稀疏编码的高光谱图像分类[D];西安电子科技大学;2014年

6 张文义;基于智能监控系统的图像质量增强算法的研究[D];南京邮电大学;2015年

7 丁文秀;基于分层深度学习的行人分类方法研究[D];合肥工业大学;2015年

8 贺兵;基于稀疏编码哈希的跨模多媒体检索[D];安徽大学;2016年

9 申丹飞;基于筛选稀疏编码的多特征融合图像分类方法[D];华东师范大学;2016年

10 孟浩浩;基于秩限制的联合字典学习[D];北京理工大学;2016年



本文编号:2443806

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2443806.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户27bd3***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com