基于人物交互动作行为识别方法研究
发布时间:2022-01-10 03:49
人体行为识别技术的飞速发展,使其逐渐渗入到许多行业,是计算机自动理解真实场景的重要步骤,有着广阔的应用前景,越来越多的研究人员对其投入研究。通过分析人体行为的复杂度,发现相对于单人行为而言,交互行为的识别存在复杂性高,冗余信息量大,特征维数高且难以区分等特点,因此交互行为的特征选取及表达对识别算法起着至关重要的作用。对交互动作的研究大部分基于RGB图像,虽然取得了较好的研究成果,但也存在一定的局限性。对于RGB图像,复杂的背景,光照强度,角度等因素都会给交互行为识别带来影响,使得识别率降低。所以在本文中,主要对如何结合深度图像选取交互动作的特征提取以及优化算法效率进行重点研究。本文的研究工作如下:利用多源信息的互补性,相应地提取了各自的特征。本文首先对深度图像采用Canny算子提取边缘特征,对RGB图像采用局部二值模式算子旋转不变模式提取纹理特征,采用光流直方图来描述动态特征;然后对提取的边缘特征及纹理特征进行加权融合;之后利用基于稀疏编码空间金字塔匹配模型(对静态融合特征和光流运动轨迹特征进行编码池化,将得到的池化特征再融合;最后采用支持向量机(Support Vector Mach...
【文章来源】:内蒙古科技大学内蒙古自治区
【文章页数】:50 页
【学位级别】:硕士
【部分图文】:
*3窗口像素灰度值
内蒙古科技大学硕士学位论文-7-产生了一个八位的二进制数,将其转化为对应的十进制数就是这个区域的LBP值。LBP算子的数学公式为:802iiiLgsgg(式2.1)其中,g表示窗口中心灰度值,1,2,...,8igi表示相邻像素的灰度值,1,00,0xsxx。这样就将二进制序列转化为十进制数字代表该区域的LBP值。原始的LBP算子的3*3固定区域应用区域比较狭窄,而实际应用中,需要满足不用尺度或频率纹理需求。之后改进的算子是以某一像素为中心在圆周上等间距选取像素点,其中圆的半径R,圆周上采样像素点的数目为P。具体的半径R和像素点数目P需要根据图像的实际情况来确定。下面对R,P取了三对值,具体表示如图2.2所示。(a)R=1.P=8(b)R=1.5,P=12(c)R=2,P=16图2.2不同取值的圆对称邻域集LBP算子的圆形区域采样的方法对应的数学公式为:1,02PiPRiiLgsgg(式2.2)P个邻域像素点在和中心像素点灰度值进行比较后得到二进制串,加权求和后,会产生2P种二进制模式。由于1g总是位于中心像素相邻采样点的同一位置,当图像发生旋转时,对应标点的灰度值会发生变化,从而会产生不同的LBP编码,为了解决图像因旋转而产生不同LBP值的问题,提出了旋转不变LBP特征。通过不断旋转最初的局部二值模式得到不同的LBP值,选取最小的LBP值对应的局部二值模式,其对应的公式为:,,min,|0,1,1nPRPRLRORLii…,P(式2.3)其中,函数RORx,i是对P比特位数值x按环形,比特位右移i次,得到局部二值模式。
内蒙古科技大学硕士学位论文-8-原始的LBP算子与其不变模式对图像处理的不同结果图如图2.3所示。(a)灰度图(b)原始LBP算子处理结果(c)旋转不变模式处理结果图2.3原始LBP算子与不变模式处理结果2.1.2边缘特征深度图像的每个像素值只和传感器距离图像中物体的距离有关,一定程度上减少了复杂背景、颜色、遮挡等因素的影响。深度图像的边缘包含丰富的信息,是区域属性发生突变的地方[24,25]。边缘上的灰度变化较平缓,其两侧变化较快。与RGB图像相比,深度图像中识别的目标更加突出,在边缘的值变化明显,所以提取出的边缘更加纯粹且良好,易于将目标与背景区分。常见的算子有Prewitt算子、Sobel算子、Canny算子等。其中,Prewitt算子和Sobel算子属于梯度算子,对灰度渐变、低噪声的图像有较好的检测结果。梯度算子比其他的算子计算起来更加简单,但是计算出来的边缘略粗糙,精度低。Canny算子对图像的边缘检测更加精准、细致,检测的结果比上述两算子效果更好。因此,本文采用Canny算子[26]对深度图像提取边缘特征,其具体计算过程如下:(1)采用高斯滤波器平滑处理图像。22221,exp()22xyGxy(式2.4)hx,yGx,yfx,y(式2.5)其中,是高斯函数的标准差,调节平滑程度;fx,y为原始图像;hx,y为平滑处理后的图像;表示卷积。(2)为了计算梯度幅值和方向,采用一阶偏导的有限差分方法。对平滑图像hx,y用22的一阶有限差分计算二维高斯函数Gx,y的梯度。
本文编号:3579996
【文章来源】:内蒙古科技大学内蒙古自治区
【文章页数】:50 页
【学位级别】:硕士
【部分图文】:
*3窗口像素灰度值
内蒙古科技大学硕士学位论文-7-产生了一个八位的二进制数,将其转化为对应的十进制数就是这个区域的LBP值。LBP算子的数学公式为:802iiiLgsgg(式2.1)其中,g表示窗口中心灰度值,1,2,...,8igi表示相邻像素的灰度值,1,00,0xsxx。这样就将二进制序列转化为十进制数字代表该区域的LBP值。原始的LBP算子的3*3固定区域应用区域比较狭窄,而实际应用中,需要满足不用尺度或频率纹理需求。之后改进的算子是以某一像素为中心在圆周上等间距选取像素点,其中圆的半径R,圆周上采样像素点的数目为P。具体的半径R和像素点数目P需要根据图像的实际情况来确定。下面对R,P取了三对值,具体表示如图2.2所示。(a)R=1.P=8(b)R=1.5,P=12(c)R=2,P=16图2.2不同取值的圆对称邻域集LBP算子的圆形区域采样的方法对应的数学公式为:1,02PiPRiiLgsgg(式2.2)P个邻域像素点在和中心像素点灰度值进行比较后得到二进制串,加权求和后,会产生2P种二进制模式。由于1g总是位于中心像素相邻采样点的同一位置,当图像发生旋转时,对应标点的灰度值会发生变化,从而会产生不同的LBP编码,为了解决图像因旋转而产生不同LBP值的问题,提出了旋转不变LBP特征。通过不断旋转最初的局部二值模式得到不同的LBP值,选取最小的LBP值对应的局部二值模式,其对应的公式为:,,min,|0,1,1nPRPRLRORLii…,P(式2.3)其中,函数RORx,i是对P比特位数值x按环形,比特位右移i次,得到局部二值模式。
内蒙古科技大学硕士学位论文-8-原始的LBP算子与其不变模式对图像处理的不同结果图如图2.3所示。(a)灰度图(b)原始LBP算子处理结果(c)旋转不变模式处理结果图2.3原始LBP算子与不变模式处理结果2.1.2边缘特征深度图像的每个像素值只和传感器距离图像中物体的距离有关,一定程度上减少了复杂背景、颜色、遮挡等因素的影响。深度图像的边缘包含丰富的信息,是区域属性发生突变的地方[24,25]。边缘上的灰度变化较平缓,其两侧变化较快。与RGB图像相比,深度图像中识别的目标更加突出,在边缘的值变化明显,所以提取出的边缘更加纯粹且良好,易于将目标与背景区分。常见的算子有Prewitt算子、Sobel算子、Canny算子等。其中,Prewitt算子和Sobel算子属于梯度算子,对灰度渐变、低噪声的图像有较好的检测结果。梯度算子比其他的算子计算起来更加简单,但是计算出来的边缘略粗糙,精度低。Canny算子对图像的边缘检测更加精准、细致,检测的结果比上述两算子效果更好。因此,本文采用Canny算子[26]对深度图像提取边缘特征,其具体计算过程如下:(1)采用高斯滤波器平滑处理图像。22221,exp()22xyGxy(式2.4)hx,yGx,yfx,y(式2.5)其中,是高斯函数的标准差,调节平滑程度;fx,y为原始图像;hx,y为平滑处理后的图像;表示卷积。(2)为了计算梯度幅值和方向,采用一阶偏导的有限差分方法。对平滑图像hx,y用22的一阶有限差分计算二维高斯函数Gx,y的梯度。
本文编号:3579996
本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/3579996.html