视频监控中运动对象提取与海量对象快速检索

发布时间:2017-10-02 06:07

  本文关键词:视频监控中运动对象提取与海量对象快速检索


  更多相关文章: 视频监控 运动对象提取 摔倒检测 快速检索 哈希学习 深度学习


【摘要】:随着技术的发展以及公共安全面临的严峻挑战,中国近年来大规模开展“平安城市”工程建设,视频监控已经在社会中得到非常广泛地应用,并成为主要的安全监控手段和方法。而在智能监控领域中,对海量监控视频进行有效地分析处理成为亟待研究的热点问题。在智能视频监控处理中存在的一些主要问题包括: (1)视频监控中从复杂场景中提取运动对象;(2)视频监控中对于特定事件进行智能分析;(3)视频监控中海量对象的快速检索。 针对这些问题,本文进行了相关研究,主要研究工作和创新点如下: 1)提出了一种基于局部频域特征的鲁棒运动对象提取方法 视频监控中人们最感兴趣的往往是那些运动的对象,然而场景中的噪声以及动态背景等会对提取结果产生很大的影响。为此,本文提出了一种基于局部频域特征的鲁棒运动对象提取方法。该方法首先从视频帧图像中提取像素级的局部频域特征,并通过非参数建模方法构建实时更新的背景模型,最后实验表明,本文的方法与现有的一些算法相比能够在动态背景以及光照变化的场景中取得更好的效果并且平均F值提升了5.46%。 2)提出了一种基于归一化运动能量图的运动对象摔倒事件检测方法 针对视频监控中需要针对特定事件监测的场景,本文提出了一种基于视频分析的运动对象摔倒事件检测方法。该方法首先使用上述运动对象提取方法从视频中提取出人体轮廓,通过使用椭圆拟合轮廓并产生归一化运动能量图,然后根据从中提取的运动特征使用多类别SVM对摔倒过程的不同阶段进行分类,最后基于一个语法校验模型进一步检测得到摔倒事件。实验结果表明,相较于现有的一些方法本文方法对于摔倒检测的灵敏度达到了95.2%。 3)提出了一种支持多种特征融合的海量对象哈希检索方法 针对传统哈希检索由于仅仅支持单种特征而存在特征描述不够充分的问题,本文研究并提出了一种支持多特征融合的海量对象哈希检索方法。该方法将多种特征利用核技巧映射到一个非线性组合的核空间中,然后在标注好的训练数据集上学习得到各个对象对应的哈希码,最后学习一个基于非线性组合核空间中超平面投影的哈希函数。基于Youtube Faces数据集和从互联网爬取的人脸图像集的实验表明,本文方法相较于现有的一些方法检索准确率最高可以提升7.6%,并且使用多特征融合的哈希结果优于仅仅使用单个特征时的结果。 4)提出了一种基于深度学习的海量对象哈希检索方法 针对在哈希学习中所提取的低层特征与高层语义之间存在很大的差异一—即“语义鸿沟”问题,本文提出了一种基于深度学习的语义相似哈希检索方案。该方案包括两种方法:基于层叠RBM的语义相似哈希学习方法(Deep Hash,即DH)和基于CNN的语义感知哈希学习方法(Deep Perceptual Hash,即DPH)。(1)DH方法:从传统哈希学习的目标出发提出新的目标函数以及正则化项,并引入了层叠RBM构建深层哈希学习模型;(2)DPH方法:基于DH方法的思想,使用CNN直接从图像学习得到哈希码,同时引入了正交约束下的学习方法,保证所得哈希码的紧凑性。在CIFARIO数据集上的实验表明,本文提出的基于深度学习的哈希方法性能要优于其他的一些“浅层”哈希方法,其中在生成48比特哈希码的情况下DH方法和DPH方法的平均准确率分别提高了5.72%和8.17%。 本文研究是国家自然科学基金“结合多粒度语义的海量视频P2P快速相似性检索”(编号:60975045)、国家科技支撑计划课题“增强型搜索系统架构、关键技术及测试规范的研究”(编号:2011BAH11B01),和中国科学院先导专项子课题“网络视频传播与控制”(编号:XDA06030900)的一部分。
【关键词】:视频监控 运动对象提取 摔倒检测 快速检索 哈希学习 深度学习
【学位授予单位】:中国科学技术大学
【学位级别】:博士
【学位授予年份】:2015
【分类号】:TN948.6
【目录】:
  • 摘要5-7
  • ABSTRACT7-9
  • 目录9-12
  • 图目录12-14
  • 表目录14-15
  • 第1章 绪论15-21
  • 1.1 研究背景及意义15-17
  • 1.2 关键问题与相关应用17-18
  • 1.3 本文主要研究内容与创新点18-19
  • 1.4 本文的组织结构19-21
  • 第2章 相关技术研究与背景21-41
  • 2.1 视频监控智能分析研究综述21-23
  • 2.2 运动对象提取相关方法与应用23-28
  • 2.2.1 运动对象提取研究现状23-26
  • 2.2.2 运动对象摔倒检测26-28
  • 2.3 海量对象快速检索28-33
  • 2.3.1 相似距离度量28-29
  • 2.3.2 快速检索方法29-33
  • 2.4 深度学习33-41
  • 2.4.1 深度学习发展与概述33-35
  • 2.4.2 深度学习常用模型35-39
  • 2.4.3 深度学习在图像检索上的应用39-41
  • 第3章 基于局部频域特征的鲁棒运动对象提取41-51
  • 3.1 问题描述41-43
  • 3.2 基于局部频域特征的鲁棒运动对象提取方法43-47
  • 3.2.1 运动对象提取架构43
  • 3.2.2 像素级局部频域特征提取43-45
  • 3.2.3 动态背景建模与更新45-47
  • 3.2.4 闪烁点消除及后处理47
  • 3.3 实验与分析47-50
  • 3.3.1 实验设置47-48
  • 3.3.2 方法对比和分析48-50
  • 3.4 总结50-51
  • 第4章 基于归一化运动能量图的运动对象摔倒检测51-65
  • 4.1 问题描述51-52
  • 4.2 基于归一化运动能量图的运动对象摔倒检测52-59
  • 4.2.1 摔倒事件检测架构52-53
  • 4.2.2 运动对象轮廓提取与表示53-55
  • 4.2.3 归一化运动能量图55-57
  • 4.2.4 运动特征提取57
  • 4.2.5 多阶段分类及语法校验方法57-59
  • 4.3 实验与分析59-63
  • 4.3.1 实验设置59-60
  • 4.3.2 方法对比和分析60-63
  • 4.4 总结63-65
  • 第5章 支持多特征融合的海量对象哈希检索65-77
  • 5.1 问题描述65-67
  • 5.2 支持多特征融合的海量对象哈希检索方法67-73
  • 5.2.1 多特征融合哈希学习架构67
  • 5.2.2 非线性组合核空间构造67-68
  • 5.2.3 有监督的哈希码学习68-71
  • 5.2.4 基于非线性多核的哈希函数学习71-73
  • 5.3 实验与分析73-76
  • 5.3.1 实验设置74
  • 5.3.2 方法对比和分析74-76
  • 5.4 总结76-77
  • 第6章 基于深度学习的海量对象哈希检索77-91
  • 6.1 相关研究77-79
  • 6.2 基于层叠RBM的深度哈希学习方法79-83
  • 6.2.1 问题描述79-80
  • 6.2.2 算法介绍80-83
  • 6.3 基于CNN的深度感知哈希学习方法83-86
  • 6.3.1 问题描述83-84
  • 6.3.2 算法介绍84-86
  • 6.4 实验与分析86-88
  • 6.4.1 实验设置86
  • 6.4.2 方法对比和分析86-88
  • 6.5 总结88-91
  • 第7章 总结与展望91-95
  • 7.1 论文工作总结91-92
  • 7.2 研究工作展望92-95
  • 参考文献95-105
  • 致谢105-107
  • 在读期间发表的学术论文与取得的研究成果107-108

【共引文献】

中国期刊全文数据库 前10条

1 李志成;秦世引;Itti Laurent;;遥感图像的显著-概要特征提取与目标检测[J];北京航空航天大学学报;2010年06期

2 ;Natural Scene Classification Inspired by Visual Perception and Cognition Mechanisms[J];重庆理工大学学报(自然科学);2011年07期

3 谢昭;高隽;;基于高斯统计模型的场景分类及约束机制新方法[J];电子学报;2009年04期

4 刘硕研;须德;冯松鹤;刘镝;裘正定;;一种基于上下文语义信息的图像块视觉单词生成算法[J];电子学报;2010年05期

5 高常鑫;桑农;;整合局部特征和滤波器特征的空间金字塔匹配模型[J];电子学报;2011年09期

6 孙显;付琨;王宏琦;;基于空间语义对象混合学习的复杂图像场景自动分类方法研究[J];电子与信息学报;2011年02期

7 徐慧朴;马孜;吴德烽;;逆向工程中三维离散点云的平滑整定新算法[J];工程设计学报;2008年02期

8 胡正平;戎怡;;基于EILBP视觉描述子结合PLSA的场景分类算法[J];光电工程;2010年11期

9 蔡睿妍;田全;;视频序列中目标的检测与跟踪[J];电视技术;2012年15期

10 黄双萍;俞龙;卫晓欣;;一种异质特征融合分类算法[J];电子技术与软件工程;2013年02期

中国重要会议论文全文数据库 前8条

1 张洁琳;林秉雄;;Gabor-SIFT:一种新的特征点匹配方法[A];第六届和谐人机环境联合学术会议(HHME2010)、第19届全国多媒体学术会议(NCMT2010)、第6届全国人机交互学术会议(CHCI2010)、第5届全国普适计算学术会议(PCC2010)论文集[C];2010年

2 王晗;滕鹏;梁玮;;使用稠密兴趣点包的非对称风景图像检索[A];第七届和谐人机环境联合学术会议(HHME2011)论文集【poster】[C];2011年

3 刘林;李金屏;王真;;基于多颜色空间和累计直方图的视频场景分类[A];第十五届全国图象图形学学术会议论文集[C];2010年

4 Jilin Hu;Shiqiang Hu;Zhuojin Sun;;A Real Time Dual-Camera Surveillance System Based On Tracking-Learning-Detection Algorithm[A];第25届中国控制与决策会议论文集[C];2013年

5 Weihai Chen;Kai Ding;Xingming Wu;;Dimension reduction based SPM for image classification[A];第25届中国控制与决策会议论文集[C];2013年

6 安国成;罗志强;李洪研;;改进运动历史图的异常行为识别算法[A];第八届中国智能交通年会优秀论文集——智能交通与安全[C];2013年

7 亓峰;刘昆;张超;王德原;;圆和维诺图相交模拟基站覆盖[A];2013年全国通信软件学术会议论文集[C];2013年

8 郑歆慰;孙显;付琨;王宏琦;;基于低秩重构领域自适应的大规模遥感图像分类方法研究[A];第三届高分辨率对地观测学术年会优秀论文集[C];2014年

中国博士学位论文全文数据库 前10条

1 田文;多视图图像的快速三维场景重建[D];华中科技大学;2010年

2 涂虬;智能视觉监视中目标检测与跟踪算法研究[D];华中科技大学;2010年

3 鹿瑞;自然图像的颜色恒常性计算研究[D];北京交通大学;2010年

4 江悦;场景图像内容表述和分类研究[D];国防科学技术大学;2010年

5 解文杰;基于中层语义表示的图像场景分类研究[D];北京交通大学;2011年

6 白明;自主移动机器人的运动规划与图像理解研究[D];大连理工大学;2011年

7 周文罡;基于局部特征的视觉上下文分析及其应用[D];中国科学技术大学;2011年

8 魏玲;真实场景中视觉搜索的背景线索效应[D];天津师范大学;2011年

9 赵才荣;基于图嵌入与视觉注意的特征抽取[D];南京理工大学;2011年

10 黄双萍;通用视觉目标识别的关键技术研究[D];华南理工大学;2011年

中国硕士学位论文全文数据库 前10条

1 林秉雄;SIFT特征匹配标准与匹配方式的改进与应用[D];大连理工大学;2010年

2 闫国青;基于SIFT的场景理解方法研究[D];长春工业大学;2010年

3 蒋志成;基于视频素材的虚拟场景生成系统[D];浙江大学;2011年

4 麻志勇;基于KD-树的点模型表示与空间变形算法研究[D];西安电子科技大学;2009年

5 冯爱萍;基于内容的图像检索系统研究[D];北京邮电大学;2011年

6 朱士蓉;基于图模型的图像分析研究[D];合肥工业大学;2011年

7 贺广南;面向语义的图像检索关键技术研究[D];南京大学;2011年

8 陈丽霞;图像对称特征的提取以及在选择性注意模型中的应用[D];电子科技大学;2011年

9 冯柯;交通视频中视点无关目标分类与检索方法研究[D];杭州电子科技大学;2009年

10 谭菊;基于视觉感知的目标特性分析[D];重庆大学;2010年



本文编号:957940

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/xxkjbs/957940.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户341d9***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com