复杂背景下的静态手语识别技术研究
本文选题:肤色聚类 + 图割 ; 参考:《沈阳工业大学》2017年硕士论文
【摘要】:进入21世纪以来,人机交互系统成为了科学界的宠儿,受到了一大批科研学者的青睐,其中手语识别技术的研究炙手可热。随着研究的深入以及社会需求的提高对手语识别的要求更加苛刻,基于视觉的手语识别成为当下研究的重点。传统的手语识别方法对环境背景,图像采集设备以及人的手势动作要求都较高,因此针对手语图像背景的复杂性,手语手形的相似性以及手语识别算法的局限性,本文提出一种新的静态手语识别系统。本文针对手语图像背景的复杂性,提出一种基于改进的肤色聚类的初分割以及利用图割方法的再分割算法,通过该方法可以在复杂背景中获取完整的手区域;其次针对手形的相似性,提出利用链码跟踪方法检测手语图像的轮廓,随后提取轮廓的凸包缺陷点、Hu矩、几何特征以及区域描绘子等多个特征值用来区分各种手语,提取的这些多特征具有综合性和区分性,能够很好地体现各种手语的形状特征;最后针对手语种类的多样性以及手语识别算法的局限性,提出多次分类识别算法即采用SVM进行依据缺陷点个数的初分类以及利用多特征融合的再分类识别算法,之后针对存在一些难以区分且非常相似的手语利用两个区域描绘子进行细分类识别,通过对手语图像进行多次的分类识别可以更好地区分每种手语且运算量小。实验得出在自采集的26种静态手语图像分类识别中平均识别率达93.18%,表明了本文提出的手语识别系统的有效性和社会实用性。
[Abstract]:Since the beginning of the 21st century, the human-computer interaction system has become the favorite of the scientific community, and has been favored by a large number of researchers, among which the research of sign language recognition technology is very hot. With the deepening of research and the improvement of social needs, sign language recognition based on vision has become the focus of current research. Traditional sign language recognition methods require high environmental background, image acquisition equipment and gesture action. Therefore, the complexity of sign language image background, the similarity of sign language hand shape and the limitation of sign language recognition algorithm are discussed. This paper presents a new static sign language recognition system. Aiming at the complexity of the background of sign language image, this paper proposes a new algorithm of initial segmentation based on improved skin color clustering and a resegmentation algorithm using graph cutting method, through which the complete hand region can be obtained in the complex background. Secondly, aiming at the similarity of hand shape, a chain-code tracking method is proposed to detect the contour of sign language images, and then to extract the Hu moments, geometric features and region descriptors of the contour to distinguish various sign languages. The extracted features are comprehensive and distinguishable, which can well reflect the shape features of various sign languages. Finally, aiming at the diversity of sign language types and the limitations of sign language recognition algorithms, In this paper, a multiple classification recognition algorithm is proposed, that is, the initial classification based on the number of defect points and the subclassification recognition algorithm based on multi-feature fusion are proposed by using SVM. Then we use two region descriptors to subdivide the sign language which is difficult to distinguish and very similar. By classifying and recognizing the sign language image for several times we can distinguish each sign language better and the computation is less. The experimental results show that the average recognition rate of 26 static sign language images collected by ourselves is 93.18, which shows the effectiveness and social practicability of the sign language recognition system proposed in this paper.
【学位授予单位】:沈阳工业大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP391.41
【相似文献】
相关期刊论文 前10条
1 刘建忠;;图像边缘的数学结构分析[J];软件;2011年05期
2 陈文兵;张小磊;;基于图像边缘的能见度计算方法[J];微型电脑应用;2009年04期
3 曾友州;胡莹;曾伟一;郑晓霞;;提取数字图像边缘的算法比较[J];成都航空职业技术学院学报;2009年04期
4 潘卫国;鲍泓;何宁;;一种传统中国书画图像的二分类方法[J];计算机科学;2012年03期
5 周涛;陆惠玲;拓守恒;马竞先;杨德仁;;基于非凸区域下近似的图像边缘修补算法[J];宁夏大学学报(自然科学版);2012年01期
6 唐亮;唐娉;阎福礼;郑柯;;HJ-1 CCD图像自动几何精纠正系统的设计与实现[J];计算机应用;2012年S2期
7 宋建中;;喷雾图像的自动分析[J];光学机械;1988年04期
8 张锦华;孙挺;;引入像点融合度修补的图像边缘化参差拼接实现[J];微电子学与计算机;2014年08期
9 张晓清;;抠图另一法[J];数字世界;2002年11期
10 潘泓;夏良正;;一种基于图像边缘的矩计算方法[J];模式识别与人工智能;2003年03期
相关会议论文 前10条
1 陆成刚;陈刚;张但;闵春燕;;图像边缘的优化模型[A];'2002系统仿真技术及其应用学术论文集(第四卷)[C];2002年
2 王伟凝;余英林;张剑超;;图像的动感特征分析[A];第一届中国情感计算及智能交互学术会议论文集[C];2003年
3 韩焱;王明泉;宋树争;;工业射线图像的退化与恢复方法[A];新世纪 新机遇 新挑战——知识创新和高新技术产业发展(下册)[C];2001年
4 王强;王风;;一种保持图像几何特征的去噪模型[A];中国通信学会第五届学术年会论文集[C];2008年
5 王培珍;杨维翰;陈维南;;图像边缘信息的融合方案研究[A];中国图象图形学会第十届全国图像图形学术会议(CIG’2001)和第一届全国虚拟现实技术研讨会(CVR’2001)论文集[C];2001年
6 李大鹏;禹晶;肖创柏;;图像去雾的无参考客观质量评测方法[A];第十五届全国图象图形学学术会议论文集[C];2010年
7 孟晋丽;张毅;金林;;图像中混合噪声的小波域滤除方法[A];2007'仪表,,自动化及先进集成技术大会论文集(一)[C];2007年
8 漆琳智;张超;吴向阳;;引导滤波的单幅图像前景精确提取[A];浙江省电子学会2013学术年会论文集[C];2013年
9 张明慧;;基于模糊蒙片算法的CR图像边缘增强[A];第六届全国信息获取与处理学术会议论文集(1)[C];2008年
10 王亮亮;李明;高昕;;强模糊空间目标图像边缘获取方法研究[A];第九届全国光电技术学术交流会论文集(下册)[C];2010年
相关重要报纸文章 前10条
1 吴飞;无边距照片打印三部曲[N];中国电脑教育报;2003年
2 艾思平翻译;视频编码软件CCE SP2操作指南(9)[N];电子报;2009年
3 ;B超术语解释[N];农村医药报(汉);2008年
4 ;图像质量调整秘技[N];电脑报;2001年
5 马骏睿 皓月;制作版画效果图片[N];中国摄影报;2007年
6 艾思平翻译;视频编码软件CCE SP2操作指南(14)[N];电子报;2009年
7 西安 张正仓;I~(2)C总线控制的HG-2220AV液晶屏视频信号驱动板[N];电子报;2003年
8 ;令挑剔的人也刮目相看[N];中国电子报;2001年
9 侯杰;国产芯片进军移动多媒体市场[N];人民邮电;2003年
10 于亮、阿鲲;技术“扫”天下[N];中国计算机报;2002年
相关博士学位论文 前10条
1 梁福来;低空无人机载UWB SAR增强成像技术研究[D];国防科学技术大学;2013年
2 周静;基于忆阻器的图像处理技术研究[D];国防科学技术大学;2014年
3 贾茜;基于时—空域插值的图像及视频上采样技术研究[D];武汉大学;2014年
4 李照奎;人脸图像的鲁棒特征表示方法研究[D];武汉大学;2014年
5 郝红星;基于干涉相位图像构建数字高程模型的关键技术研究[D];国防科学技术大学;2014年
6 杨小义;图像特征识别算法及其在聋人视觉识别中的应用研究[D];重庆大学;2015年
7 王玉明;SAR图像地雷场检测技术研究[D];国防科学技术大学;2013年
8 温景阳;图像大容量、低失真可逆信息隐藏技术研究[D];兰州大学;2015年
9 李林;基于概率图模型的图像整体场景理解方法研究[D];电子科技大学;2014年
10 冯景;基于SAR图像的海面溢油检测研究[D];北京理工大学;2015年
相关硕士学位论文 前10条
1 李鹏远;图像检索算法研究及其在互联网教育中的应用[D];华南理工大学;2015年
2 万燕英;微聚焦X-ray图像自适应正则化去噪方法[D];华南理工大学;2015年
3 毛双艳;基于梯度域的图像风格化渲染方法的研究及其应用[D];华南理工大学;2015年
4 向训文;RGB-D图像显著性检测研究[D];华南理工大学;2015年
5 曾旭;基于聚类和加权非局部的图像稀疏去噪方法研究[D];天津理工大学;2015年
6 熊杨超;图像美学评价及美学优化研究[D];华南理工大学;2015年
7 王艳;图像视觉显著性检测方法及应用的研究[D];华南理工大学;2015年
8 郑露萍;图像二阶微分特征提取及人脸识别应用研究[D];昆明理工大学;2015年
9 王思武;基于太阳图像的特征提取和检索[D];昆明理工大学;2015年
10 曹静;基于暗通道先验算法的图像去雾处理[D];海南大学;2015年
本文编号:1785167
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1785167.html