深度卷积神经网络中基于序的池化方法研究
本文关键词:深度卷积神经网络中基于序的池化方法研究 出处:《郑州大学》2017年硕士论文 论文类型:学位论文
更多相关文章: 池化 深度学习 卷积神经网络 图像分类 人群计数
【摘要】:在深度卷积神经网络(Convolutional Neural Networks,CNNs)中,池化是一个关键机制,有利于CNNs获得具有平移不变性的特征。大量的经验和理论研究表明,池化能够有效的提升CNNs的性能。传统的池化操作一般是基于激活值的。本文提出一种基于序的池化机制。提出这种池化方法的动机是,在池化域内,激活值的序只与激活值的大小关系有关,而与其实际大小无关。基于激活值的序计算池化输出有利于获得更加鲁棒的特征。此外,通过合理的使用激活值的序能够有效地避免基于值的方法所面临的数据尺度问题。基于序的池化方法可以视为一种加权池化,也就是将池化域内所有激活值的加权和作为池化输出。根据加权方式的不同,本文提出三种新的池化操作:基于序的平均池化、基于序的加权池化和基于序的随机池化。作为另外一个重要贡献,本文引入判别熵的概念,提出一种评估池化方法判别能力的准则。在图像识别和人群计数两个计算机视觉任务上评价提出的方法。在图像识别任务上,四个标准数据集(MNIST、CIFAR-10、CIFAR-100和NORB)上的实验结果表明,提出的基于序的池化方法相比于已有方法有更好的识别表现。为了进一步展示提出方法的优越性,将基于序的随机池化方法与NIN(Network-inNetwork)网络结合,在CIFAR-10和CIFAR-100数据集上获得了更加优异的识别效果。在人群计数任务上,针对摄像机透视效果、图像背景、人群密度分布不均匀和行人遮挡等问题,提出一种基于序的空间金字塔池化网络的人群计数方法。该方法将原图像分成多个具有相同透视范围的子区域并在各个子区域分别取不同尺度的子图像块,采用基于序的空间金字塔池化网络估计子图像块人数,然后相加所有子图像块人数得出原图像人数。提出的图像分块方法有效地消除了摄像机透视效果和人群密度分布不均匀对计数的影响。提出的基于序的空间金字塔池化不仅能够处理多种尺度的子图像块,而且解决了传统池化方法易损失大量重要信息和易过拟合的问题。在UCSD标准数据集上的实验结果表明,本文方法相比于传统方法具有准确率高和鲁棒性好的优点。
[Abstract]:In Convolutional Neural Networks (CNNs), pooling is a key mechanism, which is beneficial for CNNs to obtain the feature of translation invariance. A large number of empirical and theoretical studies have shown that pooling can effectively improve the performance of CNNs. Traditional pooling operations are generally based on activation values. In this paper, a pooling mechanism based on order is proposed. The motive of this pooling method is that in the pool domain, the order of the activation value is only related to the size of the activation value, but is independent of its actual size. The sequential computing pooled output based on the activation value is beneficial to obtaining more robust features. In addition, using a reasonable use of the sequence of activation values can effectively avoid the problem of data scale faced by a value based method. The pooling method based on the order can be considered as a weighted pool, that is, to weigh all the activation values in the pool domain and to be pooled output. According to the different weighting methods, this paper proposes three new pooling operations: order based average pooling, ordering based weighting pooling, and ordering based random pooling. As another important contribution, the concept of discriminant entropy is introduced in this paper, and a criterion for evaluating the discriminant ability of the pool method is proposed. The proposed method is evaluated on two computer visual tasks, which are image recognition and crowd counting. On the image recognition task, experimental results on four standard datasets (MNIST, CIFAR-10, CIFAR-100 and NORB) show that the proposed order based pooling method has better recognition performance than existing methods. In order to further demonstrate the superiority of the proposed method, a sequential randomized pool method is combined with NIN (Network-inNetwork) network to get better recognition results on CIFAR-10 and CIFAR-100 datasets. For crowd counting task, aiming at the problems of camera perspective effect, image background, uneven crowd density and pedestrian occlusion, a crowd counting method based on ordered spatial Pyramid pool network is proposed. The original image is divided into several sub regions with the same X-ray range and sub image blocks in each sub region were collected from different scales, the number of sub image blocks estimation of order space Pyramid pool based on the network, then add all the sub image blocks that number number of the original image. The proposed image segmentation method effectively eliminates the effect of the camera perspective effect and the uneven distribution of the population density on the count. The ordered spatial Pyramid pooling not only can handle multi scale sub image blocks, but also solve the problem that traditional pooling methods easily lose large amounts of important information and easily overmatch. The experimental results on the UCSD standard dataset show that the proposed method has the advantages of high accuracy and good robustness compared with the traditional method.
【学位授予单位】:郑州大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP391.41;TP183
【相似文献】
相关期刊论文 前10条
1 杨晓帅 ,付玫;神经网络技术让管理更轻松[J];软件世界;2000年11期
2 云中客;新的神经网络来自于仿生学[J];物理;2001年10期
3 唐春明,高协平;进化神经网络的研究进展[J];系统工程与电子技术;2001年10期
4 李智;一种基于神经网络的煤炭调运优化方法[J];长沙铁道学院学报;2003年02期
5 程科,王士同,杨静宇;新型模糊形态神经网络及其应用研究[J];计算机工程与应用;2004年21期
6 王凡,孟立凡;关于使用神经网络推定操作者疲劳的研究[J];人类工效学;2004年03期
7 周丽晖;从统计角度看神经网络[J];统计教育;2005年06期
8 赵奇 ,刘开第 ,庞彦军;灰色补偿神经网络及其应用研究[J];微计算机信息;2005年14期
9 袁婷;;神经网络在股票市场预测中的应用[J];软件导刊;2006年05期
10 尚晋;杨有;;从神经网络的过去谈科学发展观[J];重庆三峡学院学报;2006年03期
相关会议论文 前10条
1 徐春玉;;基于泛集的神经网络的混沌性[A];1996中国控制与决策学术年会论文集[C];1996年
2 周树德;王岩;孙增圻;孙富春;;量子神经网络[A];2003年中国智能自动化会议论文集(上册)[C];2003年
3 罗山;张琳;范文新;;基于神经网络和简单规划的识别融合算法[A];2009系统仿真技术及其应用学术会议论文集[C];2009年
4 郭爱克;马尽文;丁康;;序言(二)[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年
5 钟义信;;知识论:神经网络的新机遇——纪念中国神经网络10周年[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年
6 许进;保铮;;神经网络与图论[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年
7 金龙;朱诗武;赵成志;陈宁;;数值预报产品的神经网络释用预报应用[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年
8 田金亭;;神经网络在中学生创造力评估中的应用[A];第十二届全国心理学学术大会论文摘要集[C];2009年
9 唐墨;王科俊;;自发展神经网络的混沌特性研究[A];2009年中国智能自动化会议论文集(第七分册)[南京理工大学学报(增刊)][C];2009年
10 张广远;万强;曹海源;田方涛;;基于遗传算法优化神经网络的故障诊断方法研究[A];第十二届全国设备故障诊断学术会议论文集[C];2010年
相关重要报纸文章 前10条
1 美国明尼苏达大学社会学博士 密西西比州立大学国家战略规划与分析研究中心资深助理研究员 陈心想;维护好创新的“神经网络硬件”[N];中国教师报;2014年
2 卢业忠;脑控电脑 惊世骇俗[N];计算机世界;2001年
3 葛一鸣 路边文;人工神经网络将大显身手[N];中国纺织报;2003年
4 中国科技大学计算机系 邢方亮;神经网络挑战人类大脑[N];计算机世界;2003年
5 记者 孙刚;“神经网络”:打开复杂工艺“黑箱”[N];解放日报;2007年
6 本报记者 刘霞;美用DNA制造出首个人造神经网络[N];科技日报;2011年
7 健康时报特约记者 张献怀;干细胞移植:修复受损的神经网络[N];健康时报;2006年
8 刘力;我半导体神经网络技术及应用研究达国际先进水平[N];中国电子报;2001年
9 ;神经网络和模糊逻辑[N];世界金属导报;2002年
10 邹丽梅 陈耀群;江苏科大神经网络应用研究通过鉴定[N];中国船舶报;2006年
相关博士学位论文 前10条
1 杨旭华;神经网络及其在控制中的应用研究[D];浙江大学;2004年
2 李素芳;基于神经网络的无线通信算法研究[D];山东大学;2015年
3 石艳超;忆阻神经网络的混沌性及几类时滞神经网络的同步研究[D];电子科技大学;2014年
4 王新迎;基于随机映射神经网络的多元时间序列预测方法研究[D];大连理工大学;2015年
5 付爱民;极速学习机的训练残差、稳定性及泛化能力研究[D];中国农业大学;2015年
6 李辉;基于粒计算的神经网络及集成方法研究[D];中国矿业大学;2015年
7 王卫苹;复杂网络几类同步控制策略研究及稳定性分析[D];北京邮电大学;2015年
8 张海军;基于云计算的神经网络并行实现及其学习方法研究[D];华南理工大学;2015年
9 李艳晴;风速时间序列预测算法研究[D];北京科技大学;2016年
10 陈辉;多维超精密定位系统建模与控制关键技术研究[D];东南大学;2015年
相关硕士学位论文 前10条
1 时增林;深度卷积神经网络中基于序的池化方法研究[D];郑州大学;2017年
2 章颖;混合不确定性模块化神经网络与高校效益预测的研究[D];华南理工大学;2015年
3 贾文静;基于改进型神经网络的风力发电系统预测及控制研究[D];燕山大学;2015年
4 李慧芳;基于忆阻器的涡卷混沌系统及其电路仿真[D];西南大学;2015年
5 陈彦至;神经网络降维算法研究与应用[D];华南理工大学;2015年
6 董哲康;基于忆阻器的组合电路及神经网络研究[D];西南大学;2015年
7 武创举;基于神经网络的遥感图像分类研究[D];昆明理工大学;2015年
8 李志杰;基于神经网络的上证指数预测研究[D];华南理工大学;2015年
9 陈少吉;基于神经网络血压预测研究与系统实现[D];华南理工大学;2015年
10 张韬;几类时滞神经网络稳定性分析[D];渤海大学;2015年
,本文编号:1346221
本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/1346221.html