图像特征识别算法及其在聋人视觉识别中的应用研究

发布时间:2017-07-20 10:11

  本文关键词:图像特征识别算法及其在聋人视觉识别中的应用研究


  更多相关文章: 图像特征 聋人视觉 分水岭算法 纹理一致性测度 改进LBP BP模糊神经网络


【摘要】:随着计算机技术和信息技术的飞速发展,3G生活已经走进了千家万户,4G技术也已经开始崭露头角,这些高新技术的出现,使人们的工作和生活产生了史无前例的巨大变化。借助这些高新技术,人们的工作更加快捷,生活也更为便利,同时,对一直存在于我们身边的弱势群体——聋哑人群体也更加地关注。中国现有聋哑人2000多万,为了使这2000多万聋哑人更好更快地融入到正常社会生活之中,消除健全人与聋哑人之间交流的障碍,提高他们的生活质量,真正地实现融合共生,构建社会和谐,聋人视觉识别研究已受到国内越来越多的专家和学者关注。在现有的各种聋人视觉识别算法中,处于主导地位的主要是基于数据手套的聋人视觉识别和基于数字图像处理的聋人视觉识别方法。大部分研究是将两种算法相结合,前者主要用于图像的采集,而用后者进行图像的识别和处理,以便取得更好的识别效果。尽管聋人视觉识别已经取得某些进展,但仍然面临如手势不变特征的提取、手势之间的过渡模型等许多挑战性课题,导致目前的手语识别算法在识别率,健壮性等方面存在诸多不足。本文对上述问题进行了研究,并取得了阶段性的研究成果,且将其应用于作者承担开发的聋哑人视觉识别交流系统的应用软件研制,部分地已投入了实际教学试用。尽管该应用软件还存在许多有待改进完善之处,但仍然取得了良好的应用效果,并受到从事相关工作单位的肯定。从事研究期间的主要工作和创新性集中地归纳为以下几个方面:①针对分水岭算法对噪声十分敏感,容易引起边缘不连续,伪边缘、过分割等现象,提出一种基于形态学和分水岭算法相结合的图像几何特征辨识算法。该算法借助前者获取将图像的前景色和背景色最大程序分开的最佳阈值,再利用该阈值对后者的路径代价函数进行限制,从而缩小查找范围,提高了算法的执行速度。②针对目前各种融合算法在图像识别中存在的光谱特性扭曲、算法复杂度高,内存需求量大,难以兼顾图像的整体结构和细节等问题,提出一种基于双正交小波变换纹理一致性测度融合算法。该算法根据正交小波变换对于融合的源图像分别进行小波分解,其低频系数按比例选取图像的小波系数构成融合图像小波低频系数矩阵,高频系数采用纹理一致性测度分析特定区域不同高低频系数的边缘特性,并以一定规则确定融合图像高频小波系数矩阵。实验结果表明,该融合算法既可较好地分辨出伪边缘,使细节信息更加丰富和真实,又兼顾了整体视觉效果,具有较好的识别效果。③针对手形识别的局限性,提出一种基于模糊BP神经网络的手语融合识别算法。该算法借助模糊BP神经网络,将采集的手形和唇形图像进行融合计算,其融合图像被分别视为手形和唇形模糊集,对模糊集进行模糊算子操作,将操作结果与数据库手语符号进行匹配,然后将获取的两个手语集再进行模糊集合运算,最后得到识别结果。实验表明了该算法的有效性。④针对在复杂光照条件下,传统人脸特征识别算法往往忽略了局部区域像间的对比度,丢弃了部分重要的纹理特征信息,导致识别效果不理想,提出一种改进的LBP人脸特征识别算法。该算法先对不同复杂光照下的人脸图像进行光照归一化预处理,将光照变化控制在一定范围之内,再借助改进的LBP算法将局部区域像素间的对比度值映射为一个区间值,使光照变化引起的对比度值在控制区间内波动,从而使图像具有光照不变性,使之可较好地识别出人脸特征。
【关键词】:图像特征 聋人视觉 分水岭算法 纹理一致性测度 改进LBP BP模糊神经网络
【学位授予单位】:重庆大学
【学位级别】:博士
【学位授予年份】:2015
【分类号】:TP391.41
【目录】:
  • 中文摘要3-5
  • 英文摘要5-11
  • 1 绪论11-23
  • 1.1 研究的背景及意义11-12
  • 1.2 聋人视觉识别的国内外研究现状12-16
  • 1.3 聋人视觉识别的研究难点和发展方向16-19
  • 1.4 聋人视觉识别的特征19
  • 1.5 本文的研究内容和结构安排19-21
  • 1.6 本章小结21-23
  • 2 基于形态学和分水岭的聋人视觉边缘提取算法23-41
  • 2.1 引言23
  • 2.2 二值形态学23-28
  • 2.3 模糊形态学28-32
  • 2.3.1 模糊子集定义28
  • 2.3.2 l水平截集28-29
  • 2.3.3 模糊形态学算法29-30
  • 2.3.4 模糊模式识别方法30-32
  • 2.4 改进的分水岭算法32-33
  • 2.4.1 分水岭算法32
  • 2.4.2 基于图像森林变换的分水岭算法32-33
  • 2.5 改进的边缘提取算法33-39
  • 2.5.1 自动识别最优阈值的方法33-34
  • 2.5.2 基于模糊形态学的边缘提取算法研究34-36
  • 2.5.3 实验结果和分析36-39
  • 2.6 本章小结39-41
  • 3 双正交小波变换纹理一致测度的聋人视觉融合算法41-59
  • 3.1 引言41
  • 3.2 背景知识41-43
  • 3.2.1 图像融合41-42
  • 3.2.2 纹理一致性测度42-43
  • 3.3 小波变换43-50
  • 3.3.1 正交小波变换44
  • 3.3.2 二尺度方程44-45
  • 3.3.3 正交小波变换(Mallat塔式算法)45-47
  • 3.3.4 快速小波变换的分解与重构47-50
  • 3.4 改进的纹理一致性测度融合算法50-54
  • 3.4.1 双正交小波50-52
  • 3.4.2 双正交小波变换纹理一致测度的算法研究52-54
  • 3.5 实验结果及其分析54-57
  • 3.5.1 融合算法计算结果55-56
  • 3.5.2 融合算法性能分析56-57
  • 3.6 本章小结57-59
  • 4 基于模糊神经网络的聋人视觉识别算法59-75
  • 4.1 引言59
  • 4.2 BP神经网络59-63
  • 4.2.1 BP神经网络模型59-60
  • 4.2.2 BP神经网络算法60-63
  • 4.3 模糊神经网络63-66
  • 4.3.1 模糊系统63-65
  • 4.3.2 模糊神经网络65-66
  • 4.4 模糊BP神经网络的聋人视觉识别算法研究66-69
  • 4.4.1 手语知识66
  • 4.4.2 模糊神经网络架构66-68
  • 4.4.3 实现计算步骤68-69
  • 4.5 实验结果及分析69-73
  • 4.5.1 算法实验69-72
  • 4.5.2 实验性能分析72-73
  • 4.6 本章小结73-75
  • 5 复杂环境下聋人视觉表情识别75-89
  • 5.1 引言75
  • 5.2 LBP理论75-80
  • 5.2.1 LBP算子的优势75-76
  • 5.2.2 基本LBP算子76-80
  • 5.2.3 LBP中的Ahonen方法80
  • 5.3 改进LBP算法在复杂环境下的聋人视觉表情识别80-84
  • 5.3.1 ALBP算法思想81
  • 5.3.2 提取LBP特征层81-82
  • 5.3.3 光照归一化预处理82-84
  • 5.4 实验结果及性能分析84-86
  • 5.5 本章小结86-89
  • 6 总结与展望89-91
  • 6.1 本文研究工作总结89-90
  • 6.2 工作展望90-91
  • 致谢91-93
  • 参考文献93-101
  • 附录101-102
  • A. 作者在攻读博士学位期间录用和发表论文情况101-102
  • B. 作者在攻读博士学位期间参加的科研项目102

【参考文献】

中国期刊全文数据库 前7条

1 王兆其,杨长水,高文;基于VRML的中国手语三维显示[J];计算机研究与发展;2003年03期

2 高文,陈熙霖,马继勇,王兆其;基于多模式接口技术的聋人与正常人交流系统[J];计算机学报;2000年12期

3 邓廷权,陈延梅,吴从p,

本文编号:567486


资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/xxkjbs/567486.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户18f4e***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com