自适应视频镜头边界检测及关键帧提取方法研究
发布时间:2021-04-12 05:21
随着信息技术的发展,各种各样的信息充斥到人们的生活中,视频数据也是其中之一,人们在享受海量视频带给人们各种便利的同时也面临着如何管理视频数据的问题。视频检索、标注、索引、摘要等后续工作迫切需要对视频内容的分析,视频边界检测和关键帧提取正是这些后续工作完成的基础和关键。本课题将视频镜头边界检测和关键帧提取两项技术作为研究重点,针对目前镜头边界检测算法和关键帧提取算法中存在的问题进行研究,设计并制作了实验系统平台,主要研究内容如下:1.针对目前视频镜头边界检测算法中易造成错检和漏检、人工确定阈值具有不确定性及渐变镜头相邻帧之间特征变化较小难以检测到的情况,提出了一种融合RGB颜色直方图特征与方向梯度直方图(HOG)特征的自适应阈值多步比较方案镜头边界检测算法,通过计算多个步骤的帧间差异,生成一个多步帧差模式距离图,分析不同镜头在模式距离图中的变化来确定突变镜头和渐变镜头。又采用卷积神经网络(CNN)对视频帧提取特征,并用该算法与单一特征算法及其他文献算法做比较。2.针对目前视频关键帧提取算法中由于前景目标过小、背景占据主导地位所造成的关键帧提取过程中出现的漏选问题以及运动类视频中运动目标特...
【文章来源】:山东理工大学山东省
【文章页数】:67 页
【学位级别】:硕士
【部分图文】:
关键帧示例图
山东理工大学硕士学位论文第三章自适应阈值镜头边界检测算法18图3.6多尺度圆形LBP算子图Fig.3.6Multi-scalecircularLBPoperatorgraph图3.6中左侧的图中P4,R1.0,中间图中P8,R1.0,右侧图中P12,R1.5。Maenpaa等人通过对LBP算子进行扩展进而提出旋转不变LBP算子,其有效改善了原始LBP算子中对同一图像的旋转图像得到不同的LBP值的问题。旋转不变LBP算子原理主要是通过不断旋转圆形邻域从而得到若干初始定义的LBP值,并在这若干个初始定义值中寻找最小值作为该领域的LBP值。旋转不变LBP示意图如图3.7所示。旋转图3.7旋转不变LBP示意图Fig.3.7otationinvariantLBPschematicdiagram在图3.7中原始LBP图中得到的LBP值转化为二进制编码对其进行循环移位可以得到8种移位结果,其中黑色的圆点表示0,白色的圆点表示1,即原始LBP图中得到的LBP值转化为二进制编码为(11100001),得到的8种移位结果中从左到右的二进制编码依次为(11110000)、(01111000)、(00111100)、(00011110)、(00001111)、(10000111)、(11000011)。转化为对应的十进制LBP数值依次为:240、120、60、30、15、135、195。根据旋转不变LBP算子的原理取最小值15作为该邻域的LBP值。3.1.4本文特征提取方法1.RGB颜色直方图特征
( , ) ( 1, ) ( 1, )( , ) ( , 1) ( , 1)xyG x y H x y H x yG x y H x y H x y (3.21) 式中 ( , )xG x y 、 ( , )yG x y 、H(x, y) 分别表示输入图像中像素点 (x, y) 处的水平方向梯度,垂直方向梯度和像素值。像素点(x, y) 处的梯度幅值和梯度方向分别: 2 2( , ) ( , ) ( , )x yG x y G x y G x y (3.22) 1( , )( , ) tan( )( , )yxG x yx yG x y (3.23) 对于彩色图像而言,由于其具有多个通道,在每个通道上获得相应的值并选择其梯度最大的通道作为梯度向量。提取本实验数据集 RAI 的第一段视频中发生突变的第 00717 帧和第 00718 帧的 HOG 特征如图 3.8 所示:
本文编号:3132700
【文章来源】:山东理工大学山东省
【文章页数】:67 页
【学位级别】:硕士
【部分图文】:
关键帧示例图
山东理工大学硕士学位论文第三章自适应阈值镜头边界检测算法18图3.6多尺度圆形LBP算子图Fig.3.6Multi-scalecircularLBPoperatorgraph图3.6中左侧的图中P4,R1.0,中间图中P8,R1.0,右侧图中P12,R1.5。Maenpaa等人通过对LBP算子进行扩展进而提出旋转不变LBP算子,其有效改善了原始LBP算子中对同一图像的旋转图像得到不同的LBP值的问题。旋转不变LBP算子原理主要是通过不断旋转圆形邻域从而得到若干初始定义的LBP值,并在这若干个初始定义值中寻找最小值作为该领域的LBP值。旋转不变LBP示意图如图3.7所示。旋转图3.7旋转不变LBP示意图Fig.3.7otationinvariantLBPschematicdiagram在图3.7中原始LBP图中得到的LBP值转化为二进制编码对其进行循环移位可以得到8种移位结果,其中黑色的圆点表示0,白色的圆点表示1,即原始LBP图中得到的LBP值转化为二进制编码为(11100001),得到的8种移位结果中从左到右的二进制编码依次为(11110000)、(01111000)、(00111100)、(00011110)、(00001111)、(10000111)、(11000011)。转化为对应的十进制LBP数值依次为:240、120、60、30、15、135、195。根据旋转不变LBP算子的原理取最小值15作为该邻域的LBP值。3.1.4本文特征提取方法1.RGB颜色直方图特征
( , ) ( 1, ) ( 1, )( , ) ( , 1) ( , 1)xyG x y H x y H x yG x y H x y H x y (3.21) 式中 ( , )xG x y 、 ( , )yG x y 、H(x, y) 分别表示输入图像中像素点 (x, y) 处的水平方向梯度,垂直方向梯度和像素值。像素点(x, y) 处的梯度幅值和梯度方向分别: 2 2( , ) ( , ) ( , )x yG x y G x y G x y (3.22) 1( , )( , ) tan( )( , )yxG x yx yG x y (3.23) 对于彩色图像而言,由于其具有多个通道,在每个通道上获得相应的值并选择其梯度最大的通道作为梯度向量。提取本实验数据集 RAI 的第一段视频中发生突变的第 00717 帧和第 00718 帧的 HOG 特征如图 3.8 所示:
本文编号:3132700
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3132700.html
最近更新
教材专著