当前位置:主页 > 科技论文 > 软件论文 >

基于深度学习方法的行人属性自动识别及其在监视系统行为分析中的应用

发布时间:2018-09-19 17:41
【摘要】:基于当今时代维护社会安全的迫切需要,国内外学者对视频监控技术的研究广泛兴起。一般,基于人力的视频监控过程需要观察者的连续监控,由于信息的稀疏性以及人类难以长时间保持注意力集中,在视频监控工作中,人类观察者在观察中可能会多次错过导致各种安全问题的重要事件。因此,视频监控技术正在朝视频分析的方向发展,即应用计算机对视频流进行自动分析。使用视频分析技术自动分析行人行为是当前重要研究方向。本研究对此进行了相关调研,并在此基础上,提出在监控系统中利用深度学习技术自动识别行人属性的行为分析解决方案。本研究提出了五个重要行人属性,并基于该属性自动描述人类行为。这些属性包括(a)行人的全身朝向(行人移动方向),(b)行人的注意力方向/头部姿态估计(行人观察方向),(c)摄像机视野(FOV)中行人的距离和尺寸(高度和宽度),(d)行人存在的识别,以及(e)行人的性别识别(男性或女性)。(1)行人行动方向和意图预测。预测行人的行动方向和意图已经成为人类行动认知的主要应用之一。在移动过程中,行人具有多种可能的视觉注意方向。应用计算机视觉对行人的行动方向和意图进行预测是对行人的行为研究的主要手段。本文提出利用深度学习方法对行人头部姿态和全身方向进行估计。基于两个拥有八方向视角的数据集分别训练卷积神经网络模型,实现方向预测。本研究在现有数据集和各种场景下实际拍摄的视频序列数据集上进行测试实验。实验结果表明,本文所提出的方法成功估计了各种环境中的行人头部姿态和身体视角。(2)行人分类。基于计算机视觉的行人分类已经成为多年来的热点问题。行人识别方法主要分为基于传统方法的行人分类方法和基于神经网络的行人分类方法。本研究利用堆栈式稀疏自动编码器提取包含行人对象的特征,通过图流形排序方法借助SLIC超像素迭代生成包含行人图像的突出特征地图,然后输入到堆栈式稀疏自动编码器。最后,将利用堆栈式自动编码器得到重建的数据传递到Softmax分类器中进行分类。(3)行人尺度度量。在许多情况下,需要在实时环境中对摄像机中的行人进行距离和尺寸计算。高效、方便的非接触距离估计方法是行人尺度估计的主要方法。本研究提出基于数学变换的单目摄像机视野内的行人对象距离和尺度度量方法。在估测之前,根据环境采用单次拍摄学习来调整摄像机。对于单次拍摄学习,首先将L形标记放置在最小距离处,之后再放在距摄像机一般远的距离处。在两个放置处计算标记的角点,并通过线性方程估测对象放置处的每个像素长度。再通过基于平均滤波器的背景减除策略获得前景运动对象,然后利用基于卷积神经网络的分类器将其预测为行人和非行人。最后,借助在单次学习步骤中读取的数据估测行人的距离和尺寸。(4)行人性别预测。行人的性别是一个软属性,在计算机视觉的许多领域具有较普遍的应用价值。目前,行人性别预测在计算机视觉中面临巨大挑战。本研究提出了基于深度学习的行人性别分类方法。在预处理阶段,通过现有的深层分解神经网络方法对行人进行解析,将该网络的输出二进制掩码应用于图像中,将其映射为行人全身图像。最后将其传递到带softmax分类器的堆栈式自动编码器中进行分类。另外,本研究提出另一种基于深度卷积神经网络的方法分析行人性别。首先,借助于现有的深层分解神经网络方法,生成行人解析图像。然后将无背景的解析图像划分为全身和上身图像,分别输入到用于性别预测的卷积神经网络模型,实现行人性别分类。基于视频数据的实验结果表明,相比于现有方法,本研究所提出的视频监控行人识别方法具有较高的鲁棒性和适用性。
[Abstract]:In general, video surveillance based on human resources requires continuous surveillance by the observer. Because of the sparsity of information and the difficulty of keeping human attention for a long time, human observers are required to monitor video surveillance. Therefore, video surveillance technology is developing towards the direction of video analysis, i.e. automatic analysis of video streams using computers. Automatic analysis of pedestrian behavior using video analysis technology is an important research direction at present. On this basis, a behavioral analysis solution is proposed to automatically identify pedestrian attributes in a monitoring system using in-depth learning technology. Five important pedestrian attributes are proposed and human behavior is described automatically based on these attributes. Posture Estimation (Pedestrian Observation Direction), (c) Distance and Size (Height and Width) of Pedestrians in Camera Vision (FOV), (d) Pedestrian Existence Recognition, and (e) Pedestrian Sex Recognition (Male or Female). (1) Pedestrian Action Direction and Intention Prediction. Prediction of Pedestrian Action Direction and Intention has become one of the main applications of human action cognition. Pedestrians have many possible visual attention directions in the course of moving. Prediction of pedestrian's direction of action and intention by computer vision is the main means of pedestrian behavior research. In this paper, depth learning method is proposed to estimate pedestrian's head posture and whole body direction. The experimental results show that the proposed method successfully estimates pedestrian head posture and body perspective in various environments. (2) Pedestrian classification. Based on the proposed method, pedestrian orientation is estimated. Pedestrian classification based on computer vision has become a hot issue for many years. Pedestrian recognition methods are mainly divided into traditional pedestrian classification methods and neural network based pedestrian classification methods. Pixels iteratively generate salient feature maps containing pedestrian images and input them to a stacked sparse automatic encoder. Finally, the reconstructed data from the stacked automatic encoder is transferred to the Softmax classifier for classification. (3) Pedestrian scale measurement. In many cases, pedestrians in the camera need to be marched in real-time environments. Line distance and dimension calculation. Efficient and convenient non-contact distance estimation method is the main method of pedestrian scale estimation. In this paper, a new method for measuring the distance and dimension of pedestrian objects in the visual field of monocular camera based on mathematical transformation is proposed. To learn, the L-shaped marker is first placed at the minimum distance, and then placed at the general distance from the camera. The corners of the marker are calculated at two locations, and the length of each pixel is estimated by the linear equation. Then the foreground moving object is obtained by the background subtraction strategy based on the average filter, and then the foreground moving object is obtained by using the background subtraction strategy based on the average filter. The classifier of convolutional neural network predicts pedestrians and non-pedestrians. Finally, pedestrians'distances and sizes are estimated by using the data read in a single learning step. (4) Pedestrian gender prediction. Pedestrian gender is a soft property and has a wide application value in many fields of computer vision. Pedestrian gender classification method based on depth learning is proposed in this paper. In the preprocessing stage, pedestrians are analyzed by the existing deep decomposition neural network method, and the output binary mask of the network is applied to the image, which is mapped to the pedestrian whole body image. In addition, another method based on deep convolution neural network is proposed to analyze pedestrian gender. Firstly, pedestrian analytical images are generated by means of the existing deep decomposition neural network method. Then the background-free analytical images are divided into whole body and upper body images, respectively. The experimental results based on video data show that the proposed method has higher robustness and applicability than the existing methods.
【学位授予单位】:中国科学技术大学
【学位级别】:博士
【学位授予年份】:2017
【分类号】:TP391.41;TN948.6

【相似文献】

相关期刊论文 前10条

1 杨晓帅 ,付玫;神经网络技术让管理更轻松[J];软件世界;2000年11期

2 云中客;新的神经网络来自于仿生学[J];物理;2001年10期

3 唐春明,高协平;进化神经网络的研究进展[J];系统工程与电子技术;2001年10期

4 李智;一种基于神经网络的煤炭调运优化方法[J];长沙铁道学院学报;2003年02期

5 程科,王士同,杨静宇;新型模糊形态神经网络及其应用研究[J];计算机工程与应用;2004年21期

6 王凡,孟立凡;关于使用神经网络推定操作者疲劳的研究[J];人类工效学;2004年03期

7 周丽晖;从统计角度看神经网络[J];统计教育;2005年06期

8 赵奇 ,刘开第 ,庞彦军;灰色补偿神经网络及其应用研究[J];微计算机信息;2005年14期

9 袁婷;;神经网络在股票市场预测中的应用[J];软件导刊;2006年05期

10 尚晋;杨有;;从神经网络的过去谈科学发展观[J];重庆三峡学院学报;2006年03期

相关会议论文 前10条

1 徐春玉;;基于泛集的神经网络的混沌性[A];1996中国控制与决策学术年会论文集[C];1996年

2 周树德;王岩;孙增圻;孙富春;;量子神经网络[A];2003年中国智能自动化会议论文集(上册)[C];2003年

3 罗山;张琳;范文新;;基于神经网络和简单规划的识别融合算法[A];2009系统仿真技术及其应用学术会议论文集[C];2009年

4 郭爱克;马尽文;丁康;;序言(二)[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年

5 钟义信;;知识论:神经网络的新机遇——纪念中国神经网络10周年[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年

6 许进;保铮;;神经网络与图论[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年

7 金龙;朱诗武;赵成志;陈宁;;数值预报产品的神经网络释用预报应用[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年

8 田金亭;;神经网络在中学生创造力评估中的应用[A];第十二届全国心理学学术大会论文摘要集[C];2009年

9 唐墨;王科俊;;自发展神经网络的混沌特性研究[A];2009年中国智能自动化会议论文集(第七分册)[南京理工大学学报(增刊)][C];2009年

10 张广远;万强;曹海源;田方涛;;基于遗传算法优化神经网络的故障诊断方法研究[A];第十二届全国设备故障诊断学术会议论文集[C];2010年

相关重要报纸文章 前10条

1 美国明尼苏达大学社会学博士 密西西比州立大学国家战略规划与分析研究中心资深助理研究员 陈心想;维护好创新的“神经网络硬件”[N];中国教师报;2014年

2 卢业忠;脑控电脑 惊世骇俗[N];计算机世界;2001年

3 葛一鸣 路边文;人工神经网络将大显身手[N];中国纺织报;2003年

4 中国科技大学计算机系 邢方亮;神经网络挑战人类大脑[N];计算机世界;2003年

5 记者 孙刚;“神经网络”:打开复杂工艺“黑箱”[N];解放日报;2007年

6 本报记者 刘霞;美用DNA制造出首个人造神经网络[N];科技日报;2011年

7 健康时报特约记者  张献怀;干细胞移植:修复受损的神经网络[N];健康时报;2006年

8 刘力;我半导体神经网络技术及应用研究达国际先进水平[N];中国电子报;2001年

9 ;神经网络和模糊逻辑[N];世界金属导报;2002年

10 邹丽梅 陈耀群;江苏科大神经网络应用研究通过鉴定[N];中国船舶报;2006年

相关博士学位论文 前10条

1 Mudassar Raza;基于深度学习方法的行人属性自动识别及其在监视系统行为分析中的应用[D];中国科学技术大学;2017年

2 李彦冬;基于卷积神经网络的计算机视觉关键技术研究[D];电子科技大学;2017年

3 杨旭华;神经网络及其在控制中的应用研究[D];浙江大学;2004年

4 李素芳;基于神经网络的无线通信算法研究[D];山东大学;2015年

5 石艳超;忆阻神经网络的混沌性及几类时滞神经网络的同步研究[D];电子科技大学;2014年

6 王新迎;基于随机映射神经网络的多元时间序列预测方法研究[D];大连理工大学;2015年

7 付爱民;极速学习机的训练残差、稳定性及泛化能力研究[D];中国农业大学;2015年

8 李辉;基于粒计算的神经网络及集成方法研究[D];中国矿业大学;2015年

9 王卫苹;复杂网络几类同步控制策略研究及稳定性分析[D];北京邮电大学;2015年

10 张海军;基于云计算的神经网络并行实现及其学习方法研究[D];华南理工大学;2015年

相关硕士学位论文 前10条

1 史晓霞;卷积神经网络的研究与应用分析[D];广东工业大学;2017年

2 章颖;混合不确定性模块化神经网络与高校效益预测的研究[D];华南理工大学;2015年

3 贾文静;基于改进型神经网络的风力发电系统预测及控制研究[D];燕山大学;2015年

4 李慧芳;基于忆阻器的涡卷混沌系统及其电路仿真[D];西南大学;2015年

5 陈彦至;神经网络降维算法研究与应用[D];华南理工大学;2015年

6 董哲康;基于忆阻器的组合电路及神经网络研究[D];西南大学;2015年

7 武创举;基于神经网络的遥感图像分类研究[D];昆明理工大学;2015年

8 李志杰;基于神经网络的上证指数预测研究[D];华南理工大学;2015年

9 陈少吉;基于神经网络血压预测研究与系统实现[D];华南理工大学;2015年

10 张韬;几类时滞神经网络稳定性分析[D];渤海大学;2015年



本文编号:2250854

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2250854.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户eafeb***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com