基于改进RBF神经网络的视频检索算法研究
【学位单位】:北京建筑大学
【学位级别】:硕士
【学位年份】:2020
【中图分类】:TP391.41;TP183
【部分图文】:
第1章绪论2图1-1视频检索流程图Figure1-1Videoretrievalflowchart基于深度学习的方法是近几年随着计算机硬件的发展以及算法优化性的提升而提出的,深度学习更多应用在图像检索领域,当前已经取得了很大的成就,例如AlexNet[4]、VGG[5]、Faster-Rcnn[6]等。基于深度学习的视频检索方法是在图像检索方法上拓展而来的,由于视频数据量庞大,深度学习方法会使得计算成本增高。本论文的研究过程首先复现了视频检索领域成熟的代码,发现当前虽然检索算法丰富,检索效果理想,但是大多数只是停留在软件实现上,导致检索系统应用环境有限制并且计算能力容易遇到瓶颈,其原因主要有以下几个方面,一视频数据规模十分庞大,无论是基于内容还是深度学习的检索方法,都需要进行复杂的计算,因此在硬件化的过程中会导致耗能巨大,因此需要在检索结果维持不变的基础上,对算法进行简化以便于硬件的实现;二是因为目前市面上的神经网络芯片成本高,灵活性差,常用的CPU和GPU在计算能力上略显不足[7]。将视频检索技术硬件实现后,可以利用硬件并行计算的能力,提升系统整体运行速度以及计算能力。因此,研究出一种实用性强、计算能力高的深度学习芯片成为当前的研究热点。1.2国内外研究现状目前,国外对视频检索领域研究开展较早,其中比较经典的视频检索系统有:(1)QBIC(QueryByImageContent)QBIC[8]图像视频检索系统是第一个基于内容的商业化图像视频检索系统,是由IBM公所于90年代研发的项目。QBIC系统可以提取待查询图像的颜色、纹理、形状等特征,其中颜色特征有色彩分布、色彩百分比等;纹理特征结合了对比度、方向性以及粗糙度等属性;形状特征包含了面积、偏心度和圆形度等概念。正是由于QBIC系统提取的图像特征不同,其提供了很多的查询方式,例如?
第1章绪论5图1-2系统研究路线图Figure1-2Systemresearchroadmap论文研究方案如下:1)提取中心向量方案在进行提取中心向量之前需要对图片进行切片操作,使用VOC数据集作为训练集,利用多级KNN算法对切片进行中心向量的提取,将提取出的中心向量保存为中心向量集中。2)特征提取方案在视频检索或者图像检索中特征提取是关键步骤,特征提取需要对图像库中的图像以及待检索图像进行切片操作,之后通过与保存在改进RBF神经网络中间层的中心向量进行距离计算,根据得到的距离值用中心向量替换,替换得到图称为向量构成图,再利用标签向量进行编码得到标签构成图。3)相似度匹配方案本方案主要研究对标签构成图的相似度匹配内容,通过比对两个标签构成图相似概率并与阈值进行比较,通过标签向量完成相似图片的检索以及中心向量集的更新。1.4论文结构全文共分为五章,每章论文内容安排如下:第一章为绪论,主要内容为本论文的研究背景及意义,以及国内外在视频检索领域的研究现状,之后对本论文的研究内容和论文结构进行分析。第二章是对视频检索算法进行概述,首先说明了视频数据的特点,并且按照结构将视频分为四层,之后从镜头边界检测、关键帧提娶特征提取和相似度计算这几个角度
第2章视频检索算法概述7第2章视频检索算法概述视频在日常生活中被广泛使用,视频数据规模也随着科学技术的发展不断扩大,学者们对于视频检索技术的研究也越发深入。本章对现有视频检索技术进行综述,总结归纳国内外对视频检索技术的研究现状,分析当前方法与技术存在的不足之处,并且为本论文接下来的研究打下基矗2.1视频数据的特点视频是一种复杂的数据流,包含文本、声音、图像于一体,视频不仅有静态信息,还包含动态信息,视频可以表现出事物发生的空间和时间信息[16]。因此,由于视频具有复杂的特性,对视频处理比较繁琐和费时,需要提前对视频进行结构化处理,再进行后续操作。视频结构可以分为四层,自上而下分别为视频层、场景层、镜头层和图像帧,如图2-1所示。视频层包含n组场景,每组场景包含文本、声音和图像信息构成了我们观看的视频;场景层可以看作多组相同镜头的组合,每一个场景包含相同的镜头;镜头指的是摄像机在不切镜的情况下持续拍出的内容,而镜头又可以被分割成一帧一帧的图像,一个镜头内的帧具有相同的特征,区别仅仅是微小的变化,若帧与下一帧特征出现较大的变化,则认为进行了镜头的切换,由于视频数据量庞大,往往需要在众多的帧中提取出关键帧来代表这一镜头,从而简化对视频操作的复杂程度。图2-1视频数据结构Figure2-1Videodatastructure视频数据具有数据量大和语义信息复杂的特点,数据量大是视频与其他数据明显的区别,正是因为这个特点当前对于视频数据的处理比较复杂。视频数据具有数据规模大以及类型繁多的特点,在当前大数据背景下视频数据起始计量单位至少是1000个T
【相似文献】
相关期刊论文 前10条
1 沙莎,罗巍,罗三定;基于重心向量分类算法的概念特征提取方法[J];计算机工程;2005年14期
2 赵捷,华玫;心电心向量同步仪的研制[J];山东生物医学工程;1994年01期
3 ;什么叫心向量?什么是心向量图?[J];江苏医药;1981年01期
4 李元诚;杨瑞仙;;用于短期风速预测的优化核心向量回归模型[J];中国电力;2012年03期
5 薛贞霞;刘三阳;齐小刚;;基于壳向量和中心向量的支持向量机[J];数据采集与处理;2009年03期
6 潘渊;李弼程;张先飞;;一种基于自适应重心向量的主题检测方法[J];计算机工程;2009年03期
7 王伟;;基于最小距离的多中心向量的增量分类算法[J];电脑知识与技术;2015年04期
8 李元诚;刘克文;;面向大规模样本的核心向量回归电力负荷快速预测方法[J];中国电机工程学报;2010年28期
9 何涛;王桂芳;马廷灿;;基于类中心向量的论文作者归属机构自动识别方法研究[J];情报学报;2019年07期
10 焦方惠;;心电图与心向量联合检查对心肌缺血诊断的价值[J];中国实用医药;2011年35期
相关博士学位论文 前10条
1 曾祥萍;自适应组合RBF滤波器理论及其应用研究[D];西南交通大学;2013年
2 罗绍华;基于RBF网络逼近的机器人自适应动态面控制方法研究[D];重庆大学;2013年
3 赵斌;基于RBF网络的北方温室温湿度控制机理的研究[D];东北林业大学;2010年
4 牟洪波;基于BP和RBF神经网络的木材缺陷检测研究[D];东北林业大学;2010年
5 顾志伟;面向结构化数据的视频检索研究[D];中国科学技术大学;2008年
6 郝艳宾;基于嵌入学习的近重复视频检索和跨域情感分类研究[D];合肥工业大学;2017年
7 肖理业;基于机器学习的电磁场建模与设计研究[D];电子科技大学;2019年
8 陈涵瀛;核电站热工水力系统工况预测与诊断方法研究[D];哈尔滨工程大学;2018年
9 梁智杰;聋哑人手语识别关键技术研究[D];华中师范大学;2019年
10 刘昂;微结构硅基光子学器件性能的研究[D];南京大学;2019年
相关硕士学位论文 前10条
1 董博晨;基于改进RBF神经网络的视频检索算法研究[D];北京建筑大学;2020年
2 赵新苗;基于中心向量的聚类算法在农业信息分类中的研究与应用[D];新疆农业大学;2016年
3 汪鑫;基于RBF神经网络的人体颅颌面多元特征信息提取技术研究[D];重庆理工大学;2013年
4 胡波;基于模糊RBF神经网络的人脸识别系统研究[D];长沙理工大学;2010年
5 王伟;基于最小距离的多中心向量的增量分类算法研究[D];南京财经大学;2015年
6 方琳;基于自适应重心向量的话题检测研究[D];东北师范大学;2013年
7 李彩玉;基于RBF神经网络的心电信号分类识别技术研究[D];云南大学;2012年
8 黄金龙;基于改进RBF神经网络的模拟电路故障诊断技术研究[D];重庆大学;2014年
9 李燕强;模糊RBF神经网络在人脸识别的应用研究[D];广州大学;2011年
10 马涛;基于模糊控制RBF神经网络短期负荷预测的研究[D];西安科技大学;2009年
本文编号:2888308
本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/2888308.html