基于黎曼流形的图像分类算法研究
本文关键词:基于黎曼流形的图像分类算法研究
更多相关文章: 图像分类 黎曼流形 自回归滑动模型 李群流形 格拉斯曼流形 正定对称矩阵 序列图像块 判别分析
【摘要】:图像分类算法是计算机视觉、模式识别和机器学习领域一个重要的研究问题。图像分类算法是从视觉图像中抽取一种或者多种特征信息(如:颜色、纹理、形状和空间信息等),通过分析统计这些图像特征,把图像划分到相应的视觉类别中。随着多媒体和互联网技术的高速发展,图像分类算法日益重要,具有广阔的应用前景,可应用到高层次语义理解、海量图像检索、视频智能监控、人机交互、医学诊断、虚拟现实等多个领域。 在图像分类算法中,视觉图像特征的有效构建和分析,尤为重要。一方面,基于全局图像特征的图像分类算法已经得到广泛研究,但是全局特征对光照、背景、角度等环境因素的变化非常敏感。与全局图像特征相比,基于局部特征的图像表示能够在一定程度上解决这些问题。另一方面,如果直接把图像特征当作向量处理,将忽视其所处空间的拓扑结构。因此为了解决这个问题,我们提出利用黎曼流形理论,分析图像特征的空间结构。而黎曼流形是一种有力的空间分析工具,通过把具有一定空间结构的图像特征描述子投影到黎曼流形上,能更加有效地分析结构化的图像特征。其中常用的黎曼流形有:格拉斯曼流形、李群流形和Stiefel流形等。 本文在国内外已有的研究基础上,对基于黎曼流形的图像分类算法及相关应用进行深入研究。本文主要研究内容和创新性工作概括如下: (1)基于序列图像块的自回归滑动平均模型 大多数现有的图像分类方法考虑到图像外观特征信息,却忽略了图像内部空间信息。针对此问题,本文引入一个基于序列图像块的图像表示方法,能够综合考虑图像局部特征和图像内部的空间位置关系。然后针对每个图像所对应的序列图像块,构建自回归滑动平均模型(Auto-Regressive and Moving Average Model, ARMA模型),进行模型参数估计。因此每个图像都可以编码为序列图像块,构建相应的图像自回归滑动平均模型。在以上研究内容的基础上,将针对模型参数空间分析、图像分类等问题,开展后续研究工作 (2)基于格拉斯曼流形和自回归滑动平均模型的图像分类算法 首先根据基于序列图像块的自回归滑动平均模型理论,把每个图像编码为序列图像块,构建图像自回归滑动平均模型,其参数子空间,可投影到格拉斯曼流形上进行相关图像分类算法研究。然后基于格拉斯曼流形上的度量算法,来构建一个格拉斯曼流形核函数,进行图像分类算法应用研究。最后在若干公开图像数据集(如:MNIST、USPS、Yale和ORL等)上验证此算法的有效性。 (3)基于李群流形和自回归滑动平均模型的人脸图像分类算法 为了有效地处理人脸图像中的复杂非线性变化,基于李群流形空间理论和分析方法,提出李群核函数来处理人脸识别、头部姿态识别等图像分类问题。我们基于序列图像块的人脸图像表示,构建自回归滑动平均模型,同时获取人脸图像的外观特征和空间信息。自回归滑动模型的参数可以参数化为一种特殊结构的上三角矩阵,其子空间结构可以构建为李群流形。基于李群流形分析的方法,对自回归滑动模型进行相似性度量,从而构建李群核函数。基于李群核函数的支持向量机分类器,进行人脸图像分类算法研究。在人脸识别和头部姿态估计等人脸图像分类问题上,最终的实验室结果显示本文所提出的算法能够超过其他人脸分析方法。 (4)基于李群流形和正定对称矩阵判别分析的图像分类算法 在李群流形的基础上,对正定对称矩阵进行判别分析,即:通过优化数据,把一个李群流形映射到另外一个低维的李群流形。具体来说,我们以正定对称矩阵空间(如:协方差矩阵)为例。正定对称矩阵是李群流形的一个具体例子,已经证明是一个图像特征表示的有效工具。基于图嵌入框架,通过优化类内紧密性和类间分离性,在李群流形上进行判别变换,从而优化李群流形上的数据结构。在维度降低的李群流形上,计算任意两个样本之间的测地线距离,构建对应的核函数,最后利用支持向量机进行图像分类算法研究。为了验证所提出算法的有效性,我们在五个公共数据集(如:Scene-15,Caltech101,UIUC运动场景,MIT室内场景和VOC07)上进行实验,均达到非常好的分类结果。
【学位授予单位】:华中科技大学
【学位级别】:博士
【学位授予年份】:2015
【分类号】:TP391.41
【相似文献】
中国期刊全文数据库 前6条
1 姜伟;李健芳;杨炳儒;;黎曼流形框架上半监督判别分析[J];计算机辅助设计与图形学学报;2014年07期
2 邹丽;温欣;林彬;;黎曼流形上非线性凸规划最优性条件的研究[J];计算机科学;2014年02期
3 陈绍荣;王宏强;黎湘;夏胜平;;一种新的黎曼流形学习方法[J];南京大学学报(自然科学版);2012年01期
4 程丹;杨钦;李吉刚;蔡强;;二维黎曼流形的Voronoi图生成算法[J];软件学报;2009年09期
5 於东军;吴小俊;HANCOCK Edwin R;杨静宇;;广义SOM及其在人脸性别识别中的应用[J];计算机学报;2011年09期
6 ;[J];;年期
中国博士学位论文全文数据库 前10条
1 王湘美;黎曼流形上次梯度算法的收敛性及其应用[D];浙江大学;2014年
2 王婷婷;黎曼流形上外微分形式理论在A-调和方程中的应用研究[D];哈尔滨工业大学;2015年
3 许春燕;基于黎曼流形的图像分类算法研究[D];华中科技大学;2015年
4 武猛;曲率有下界的黎曼流形[D];南开大学;2009年
5 蒋新荣;黎曼流形上非线性抛物方程的性质研究[D];华东师范大学;2011年
6 付风云;半(次)黎曼流形上的共形和射影映射的几何不变性研究[D];南京理工大学;2012年
7 叶桂波;黎曼流形上的学习理论—在线分类和多核算法[D];复旦大学;2007年
8 李奇睿;黎曼流形上的一些曲率问题[D];浙江大学;2014年
9 郭希;黎曼流形上曲率泛函的变分问题[D];清华大学;2013年
10 吴飞凡;切触黎曼几何上几何分析的一些研究[D];浙江大学;2015年
中国硕士学位论文全文数据库 前10条
1 曾凡奇;黎曼流形上Gradient Ricci Almost Soliton的分类及相关问题[D];河南师范大学;2015年
2 梁洪;GROMOV-HAUSDORFF距离下紧黎曼流形的收敛性定理[D];首都师范大学;2009年
3 钟慧文;具有Excess pinching的黎曼流形上的微分球定理[D];曲阜师范大学;2010年
4 吴佳贤;黎曼流形上非线性方程解的梯度估计[D];漳州师范学院;2011年
5 肖刚;黎曼流形上微分动力系统的几何结构[D];新疆师范大学;2004年
6 焦蕾;次黎曼流形上的几类变换[D];南京理工大学;2005年
7 陈德重;黎曼流形上的曲线收缩流[D];清华大学;2005年
8 刘雪娇;关于黎曼流形上A-调和方程的研究[D];哈尔滨工业大学;2010年
9 付巍巍;黎曼流形上非光滑优化最优性条件的研究[D];辽宁工程技术大学;2009年
10 陆亚哲;正曲率黎曼流形拓扑结构的研究[D];西南交通大学;2012年
,本文编号:1224156
本文链接:https://www.wllwen.com/shoufeilunwen/xxkjbs/1224156.html