基于浮点坐标系的图像处理方法及应用研究
本文选题:图像处理 + 图像变形 ; 参考:《浙江工业大学》2016年博士论文
【摘要】:现实生活中的图像在人类感知领域中所传达的信息比其他方式更真切、直观,因此利用图像进行目标识别一直都是信息智能系统最热门的课题之一。从最初的模型匹配到现在的三维图像识别,人们一直孜孜不倦地从硬件和算法上寻找一种彻底解决机器模仿人类认知的模型。“一种高维度的通用目标识别建模策略”是一种解决图像识别技术的新的构想。针对目前图像目标识别过程中无法彻底克服的姿态、表情和光照影响,本文在图像文件的格式采用一种新的描述图像对象的集合和集合间的相互关系的图像文件格式,即浮点坐标系下的图像数据模型。浮点坐标系首先与高维空间几何学的“HDG”文件相一致,标准化了仿生模式识别中的数据格式;最主要的是它将图像文件的对象信息充分挖掘出来,使得文件数据从整齐的排列中解脱出来,不仅可以按照图像内容任意组合,而且使得图像的变形、联接运算变得更加直观、简便、生动。本文的研究工作和创新点主要有:1.本文构建了一种新的图像文件的浮点坐标系格式,并对浮点坐标系的文件格式做了详细介绍。借鉴常用的图像文件格式,并结合高维空间几何学数据的基本格式,本文构建了一种用在图像文件处理领域的图像数据格式:将每个像素点的信息“R,G,B”扩展到“AX,AY,R,G,B”;为了体现图像的立体性,可以将图像内容分层,各层之间通过联接点进行组合联接。与现有图像文件格式以像素值为体现形式的数据模型不同,浮点坐标系的文件格式同时使用了像素点的位置信息和像素值信息。2.网格是图像处理的一种常用模型,本文在浮点坐标系的基础上,构建了三角网格模型。在每个三角网格中,三个顶点作为坐标约束顶点,组成三角形坐标,其余的点可以通过两个三角坐标值确定。本文推导了三角形坐标表达与笛卡儿坐标系的相互转换数学模型,并论证了三角形坐标表达的一系列性质:仿射不变性、连续性、可分解性、线性不变性和旋转、缩放、平移不变性。这些性质在图像处理领域的应用中起到了重要作用。浮点坐标系与三角形坐标将图像的描述方法从繁琐而且死板的像素点中挣脱出来,转变到以图像内容为基础的网格坐标模型上来,实现了图像的结构和纹理分离,使图像处理更加自由3.利用三角形坐标的线性不变性和旋转、缩放、平移不变性,本文提出了一种基于三角坐标的图像校正归一化算法。首先给出三角形坐标下的归一化算法;然后通过实验,对有姿态、缩放、表情影响的人脸图像进行校正、归一、去表情化处理。4.利用三角形坐标的变形连续性,本文提出了一种基于三角形坐标对小样本图像进行插值、重构图像的方法。得到的插值图像有效细化了学习样本,从而改进了仿生模式识别算法中的有效覆盖问题,实验结果证明改进后的算法是有效的。5.提出了一种描述表情的矢量坐标模型。本文通过图像在三角形坐标下的特征点结构变化,得到7种表情的位移矢量和表情矢量坐标模型,并通过实验证明了同种表情的方向性,验证了表情矢量坐标模型的有效性。最后利用表情矢量坐标模型对人脸表情进行识别研究,实验效果良好。
[Abstract]:In real life, the information conveyed in the field of human perception is more authentic and intuitive than other ways. Therefore, image recognition has always been one of the most popular topics in the information intelligent system. From the original model matching to the present 3D image recognition, people have been searching for the hardware and algorithms tirelessly. A high dimension universal target recognition modeling strategy is a new idea to solve the image recognition technology. In view of the attitude, expression and illumination that can't be completely overcome in the process of image target recognition, this paper uses a new description in the format of image file. The image file format of the relationship between the set and the set of the image object, that is, the image data model in the floating point coordinate system. The floating point coordinate system is first consistent with the "HDG" file of the high-dimensional space geometry, and the data format in the bionic pattern recognition is standardized. The most important is that it fully excavates the object information of the image file. In order to remove the file data from a neat arrangement, it can not only be combined arbitrarily according to the content of the image, but also make the image deformed. The connection operation becomes more intuitive, simple and vivid. The research work and innovation of this paper are mainly as follows: 1. the floating point coordinate system of a new image file is constructed and the floating point coordinates are constructed in this paper. The file format of the system is introduced in detail. Using the common image file format for reference, and combining the basic format of high dimensional space geometry data, this paper constructs an image data format used in the image file processing field: the information "R, G, B" of each pixel point to "AX, AY, R, G, B", in order to embody the stereoscopic image of the image, It is different from the data model of the existing image file format in the form of pixel value. The file format of the floating point coordinate system uses the pixel location information and the pixel value information.2. grid is a common model in the image processing. This paper is in floating point coordinates. On the basis of the system, a triangular mesh model is built. In each triangular mesh, three vertices are used as the vertices of coordinate constraints, and the other points can be determined by two triangular coordinates. This paper derives the mathematical model of the mutual conversion between the triangular coordinate expression and the Cartesian coordinate system, and demonstrates the expression of the triangle coordinates. A series of properties: affine invariance, continuity, decomposability, linear invariance, rotation, scaling and translation invariance. These properties play an important role in the application of image processing. The floating point coordinate system and triangular coordinate transform the image description method from the tedious and rigid pixels to the image. On the basis of the grid coordinate model, the structure and texture of the image are separated. The image processing is more free and 3. uses the linear invariance and rotation, scaling and translation invariance of the triangle coordinates. In this paper, a kind of image correction normalization algorithm based on triangular coordinates is proposed. First, the normalization of the triangle coordinates is given. And then, through experiments, the face images which have the influence of attitude, zoom and expression are corrected, and then, to deal with the deformation continuity of.4. using triangular coordinates, a method of interpolation and reconstruction of small sample images based on triangular coordinates is proposed. The effective coverage problem in the bionic pattern recognition algorithm is improved. The experimental results show that the improved algorithm is an effective.5. to propose a vector coordinate model describing the expression. In this paper, the displacement vector and the expression vector coordinate model of 7 kinds of expressions are obtained by the change of the feature point structure in the triangle coordinates, and the experiment is carried out through the experiment. The directionality of the same expression is proved, and the validity of the expression vector coordinate model is verified. Finally, the facial expression is identified by the expression vector coordinate model, and the experimental results are good.
【学位授予单位】:浙江工业大学
【学位级别】:博士
【学位授予年份】:2016
【分类号】:TP391.41
【相似文献】
相关期刊论文 前10条
1 ;图像处理中心简介[J];宇航学报;2001年04期
2 陈伯涛;办公室里新来的图像处理专家[J];电子与电脑;2001年03期
3 严肃;图像处理超出狭义的范围[J];中南民族学院学报(自然科学版);2001年02期
4 ;数据图像处理三大技术[J];计算机时代;2004年12期
5 魏麒,何勇;图像处理中的一个两阶段半杂交流水作业问题(英文)[J];Applied Mathematics:A Journal of Chinese Universities;2005年04期
6 阿飞;图像处理软件的色彩车间——“通道”[J];电脑爱好者;2005年03期
7 潘路;赵文娟;;图像处理课程教学探讨[J];中国西部科技;2006年22期
8 苏晓;;基于GDI+的自建图像处理库[J];当代经理人;2006年09期
9 汪新星;吴秀玲;刘卫平;孙俊英;;高分辨电子显微像图像处理技术的应用[J];材料导报;2007年06期
10 杨琛;;图像处理中分辨率的选取[J];科技信息(学术研究);2008年10期
相关会议论文 前10条
1 苑廷刚;李爱东;李汀;艾康伟;严波涛;;图像处理技术在田径科研中的应用初探[A];第七届全国体育科学大会论文摘要汇编(二)[C];2004年
2 黄海永;朱浩;王朔中;;图像处理软件中宏结构的实现和扩展[A];面向21世纪的科技进步与社会经济发展(上册)[C];1999年
3 杨文杰;刘浩学;;基于马尔可夫场理论的图像处理新方法评述[A];面向21世纪的科技进步与社会经济发展(上册)[C];1999年
4 王晋疆;刘文耀;肖松山;陈晓东;孙正;;光电图像处理课程中教学环节的设计[A];光电技术与系统文选——中国光学学会光电技术专业委员会成立二十周年暨第十一届全国光电技术与系统学术会议论文集[C];2005年
5 王鹏;;图像处理技术与实验数据处理[A];全面建设小康社会:中国科技工作者的历史责任——中国科协2003年学术年会论文集(上)[C];2003年
6 王晓剑;曹婉;王莎莎;;一种基于高速DSP的图像处理应用平台[A];2008中国仪器仪表与测控技术进展大会论文集(Ⅲ)[C];2008年
7 张炜;蒋大林;郎芬玲;曹广鑫;王秀芬;;图像处理技术应用于选矿领域的综述[A];第九届全国信息获取与处理学术会议论文集Ⅱ[C];2011年
8 刘春桐;赵兵;张志利;仲启媛;;基于图像处理的自动瞄准系统精度研究[A];全国自动化新技术学术交流会会议论文集(一)[C];2005年
9 李向荣;;美式落袋球自动摆球系统的图像处理研究[A];2008中国仪器仪表与测控技术进展大会论文集(Ⅲ)[C];2008年
10 周荣官;周醒驭;;地质雷达图像处理在崩塌隐患探测中的应用及分析[A];第六届全国信号和智能信息处理与应用学术会议论文集[C];2012年
相关重要报纸文章 前10条
1 新疆大学纺织与服装学院 袁春燕;图像处理技术让数据更真实[N];中国纺织报;2013年
2 杨朝晖;我邻域图像处理达到每秒1350亿次超高速[N];科技日报;2008年
3 吴启海;图像处理时8位/通道或16位/通道模式的选择探讨[N];中国摄影报;2012年
4 殷幼芳;印前图像处理技术对印刷质量的影响[N];中国包装报;2005年
5 徐和德;图像处理要适度[N];中国摄影报;2006年
6 记者 申明;中星微发布场景高保真图像处理技术[N];科技日报;2010年
7 杨玉军;邮编图像处理技术通过验收[N];中国邮政报;2000年
8 董长生 吴志军;用图像处理软件推动刑侦信息技术工作[N];人民公安报;2003年
9 殷幼芳;艺术化的图像处理技术[N];中国包装报;2006年
10 ;富士图像处理方案走进手机[N];计算机世界;2002年
相关博士学位论文 前10条
1 罗军;图像处理快速算法研究与硬件化[D];武汉大学;2014年
2 孙传猛;煤岩图像处理及细观损伤本构模型研究[D];重庆大学;2015年
3 嵇晓平;基于各向异性扩散方程图像处理问题的研究[D];哈尔滨工业大学;2015年
4 黎海生;量子图像处理关键技术研究[D];电子科技大学;2014年
5 吴玉莲;非局部信息和TGV正则在图像处理中的应用研究[D];西安电子科技大学;2015年
6 张还;聚合物复合材料微观图像处理与分析[D];南京农业大学;2014年
7 刘宇飞;基于模型修正与图像处理的多尺度结构损伤识别[D];清华大学;2015年
8 樊瑶;基于图像处理的路面裂缝检测关键技术研究[D];长安大学;2016年
9 陆飞;基于浮点坐标系的图像处理方法及应用研究[D];浙江工业大学;2016年
10 程科;模糊形态学技术及其在图像处理中的应用[D];南京理工大学;2006年
相关硕士学位论文 前10条
1 董国龄;基于图像处理技术的水表自动检定及管理系统的设计[D];天津理工大学;2015年
2 李永晨;基于DSP的多路图像处理硬件系统研究[D];天津理工大学;2015年
3 杜高峰;基于opencv图像处理的列车受电弓动态特性监测方法研究[D];西南交通大学;2015年
4 王世豪;基于小波及压缩感知的图像处理方法及应用研究[D];燕山大学;2015年
5 牛蕾;基于非线性动力系统的图像处理[D];东北林业大学;2015年
6 宋君毅;基于图像处理的鱼群监测技术研究[D];天津理工大学;2015年
7 古伟楷;基于异构计算技术的视频与图像处理研究[D];华南理工大学;2015年
8 康睿;基于图像处理的砂土颗粒细观特性分析[D];宁夏大学;2015年
9 赵杰;柴油喷雾粒子图像处理及软件的设计[D];长安大学;2015年
10 石璐;基于图像处理的矿质混合料级配检测算法研究[D];长安大学;2015年
,本文编号:2043830
本文链接:https://www.wllwen.com/shoufeilunwen/xxkjbs/2043830.html