受神经科学启发的计算机识别和注意模型
本文选题:计算机视觉 + 深度学习 ; 参考:《清华大学》2016年博士论文
【摘要】:神经科学对计算机视觉有很强的借鉴意义。人的视觉神经系统具有出色的视觉感知能力,可以快速地对海量视觉输入进行压缩和选择,通过层级通路对信息进行高效表示,利用各种复杂的神经机制去适应环境。在几十年的发展历程中,计算机视觉从神经科学中获得了不少灵感和启发,一些计算模型和视觉系统的研究有密切联系,比如手工设计的视觉特征与神经元的感受野、卷积神经网络与初级视皮层和层级通路、显著性模型与视觉搜索实验等。本文的基本思路就是利用神经科学的启发去改进和提出新的计算机视觉模型。全文内容分为两部分,分别对应识别和注意这两种视觉的基本功能。第一部分提出了一种层级递归结构的神经网络,基于该模型对图像分类、场景标注、EEG信号识别等任务进行了研究。这部分的启发来自于神经系统中广泛存在的递归连接。第二部分从层级特征的角度出发对视觉注意力和显著性进行了研究,提出基于中高层特征的注意力和显著性模型。这部分的启发来自于对注意力研究的一些实验结果的总结。本文的创新之处在于从神经科学的研究成果中提取对计算机视觉有用的结构和原理,基于这些结果提出新的计算机模型,并在各种应用任务中取得了优异的效果。创新点主要体现在以下两方面:提出了一种新型的深层递归结构的模型:递归卷积神经网络,并将该模型扩展到多个任务的应用中,均取得了优异的效果。在图像分类中,递归卷积神经网络在使用更少参数的情况下,取得了比其他先进水平模型更好的性能。在场景标注中,多尺度递归卷积神经网络以端对端的方式处理任务,在准确度和速度上均达到了先进水平。我们还将模型从图像处理扩展到一维序列处理,并应用于EEG信号识别,在相关的数据竞赛中取得了优异的成绩。受相关神经科学实验结果的启发,从层级特征的角度对注意力的计算模型进行了研究。利用特征选择方法分析了各种显著性特征对眼动预测的贡献,并基于选择结果用少数特征构建出达到先进水平的显著性模型。基于中高层特征提出了新的注意力和显著性模型,这些模型相对于传统底层模型能更好地预测眼动。本文的结果支持了利用神经科学的启发去改进人工智能模型的可行性。
[Abstract]:Neuroscience is very useful for computer vision. Human visual nervous system has excellent visual perception ability, it can compress and select the massive visual input quickly, express the information efficiently through hierarchical path, and adapt to the environment by various complicated neural mechanisms. In the decades of development, computer vision has gained a lot of inspiration and inspiration from neuroscience. Some computational models are closely related to the study of visual systems, such as hand-designed visual features and neuronal receptive fields. Convolution neural network and primary visual cortex and hierarchical pathway, significant model and visual search experiments. The basic idea of this paper is to use the inspiration of neuroscience to improve and propose a new computer vision model. The content of this paper is divided into two parts, corresponding to the basic functions of recognition and attention. In the first part, a hierarchical recursive neural network is proposed. Based on the model, the tasks of image classification, scene tagging and EEG signal recognition are studied. This part of the inspiration comes from the widespread existence of recurrent connections in the nervous system. In the second part, the visual attention and salience are studied from the perspective of hierarchical features, and a model of attention and significance based on middle and high level features is proposed. This part of the inspiration comes from the summary of some experimental results of attention research. The innovation of this paper is to extract the useful structure and principle of computer vision from the research results of neuroscience. Based on these results, a new computer model is proposed, and excellent results are obtained in various application tasks. The innovations are mainly reflected in the following two aspects: a new model of deep recursive structure, recursive convolution neural network, is proposed, and the model is extended to the application of multiple tasks, and excellent results are obtained. In image classification, the recursive convolution neural network achieves better performance than other advanced level models with fewer parameters. In scene tagging, multi-scale recursive convolution neural network processes tasks in an end-to-end manner, which reaches the advanced level in accuracy and speed. We also extend the model from image processing to one-dimensional sequence processing and apply it to EEG signal recognition. Inspired by the experimental results of neuroscience, the computational model of attention was studied from the point of view of hierarchical characteristics. The contribution of various salient features to eye movement prediction is analyzed by using feature selection method. Based on the selection results, a significant model with a few features is constructed to achieve the advanced level. Based on the features of middle and high levels, a new attention and salience model is proposed, which can predict eye movement better than the traditional bottom model. The results of this paper support the feasibility of improving the artificial intelligence model with the inspiration of neuroscience.
【学位授予单位】:清华大学
【学位级别】:博士
【学位授予年份】:2016
【分类号】:TP391.41
【相似文献】
相关期刊论文 前10条
1 Tuncer I.銉ren;邵水浩;;论模型为基础的信息技术:计算机和系统理论基础[J];世界科学;1985年10期
2 廖建军;;出版产业竞争力的分层立体评价模型[J];出版科学;2007年02期
3 毛亮,陈一君;聘用期的投资模型分析[J];科技情报开发与经济;2005年02期
4 赵航,赵可心,李子奈;个人消费行为模型分析[J];长春邮电学院学报;2000年03期
5 王林林,王良元;提升服务品质的有效途径——电信互动服务模型分析[J];通信企业管理;2003年05期
6 谢波峰;兰英见;;用经济模型分析税务数据利用[J];每周电脑报;2006年16期
7 顾桥,喻良涛,梁东;论创业者能力与企业成长的关系[J];科技进步与对策;2004年12期
8 杨卫东;朱红松;张德贤;王珂;张瑜;刘伎昭;;车载容迟网络中一种基于真实轨迹的车辆移动模型[J];计算机研究与发展;2010年S2期
9 张旭;;用加热模型分析法矫正肌电图测量中的偏差[J];国外医学.生物医学工程分册;1991年04期
10 郝跃;CMOS倒相链瞬态对延迟模型分析[J];半导体学报;1992年09期
相关会议论文 前10条
1 钱林晓;王一涛;;对应试教育条件下学生学习行为的模型分析[A];2005年中国教育经济学年会会议论文集[C];2005年
2 高林;刘喜梅;;多模型中权值确定的新方法及其应用[A];2009年中国智能自动化会议论文集(第二分册)[C];2009年
3 朱萍;刘伟泽;万立滨;;基于实证研究的知识管理路线、方法和模型分析[A];航空工业档案学会七届四次理事会暨2013年度优秀论文交流会论文集[C];2013年
4 潘洁;周宗放;;全流通下KMV模型中的违约点修正及实证研究[A];中国企业运筹学[C];2009年
5 肖田元;;仿真是基于模型的活动[A];新观点新学说学术沙龙文集37:仿真是基于模型的实验吗[C];2009年
6 毛曹珏;曹锐;;两种缺陷接地结构的模型分析[A];2007年全国微波毫米波会议论文集(下册)[C];2007年
7 吴义忠;陈立平;张昌杰;;基于多领域模型分析的参数优化研究[A];庆祝中国力学学会成立50周年暨中国力学学会学术大会’2007论文摘要集(下)[C];2007年
8 董维中;;气体模型对钝体高超声速流动数值计算影响的分析[A];第十届全国计算流体力学会议论文集[C];2000年
9 侯建荣;黄培清;;基于Ito随机微分方程的客户群变动模型分析[A];2004年中国管理科学学术会议论文集[C];2004年
10 肖婷婷;;经典的逃税模型及其两周期扩展[A];第四届中国不确定系统年会论文集[C];2006年
相关重要报纸文章 前3条
1 范超;浅谈如何备战统计建模大赛[N];中国信息报;2011年
2 媛萍;用模型分析企业战略要素[N];中国高新技术产业导报;2002年
3 牛津大学博士 阿姆斯(RMS)风险管理公司亚太地区代表 高航;由近期亚太地区地震看巨灾风险[N];中国保险报;2012年
相关博士学位论文 前10条
1 李瑜;多选题认知诊断测验编制及多策略的多选题认知诊断模型的开发[D];江西师范大学;2014年
2 康慧燕;复杂网络上带有潜伏期的传染病动力学模型研究[D];上海大学;2015年
3 郭玮;基于多因素集成的疏散场模型研究[D];北京化工大学;2015年
4 张天蛟;产漂流性卵小型鱼类的生态位建模及分析[D];中国农业大学;2016年
5 张会敏;基于小域估计的贫困指标测度方法与模型研究[D];天津财经大学;2015年
6 宋泽芳;基于投资者情绪效应的均值—方差关系模型研究[D];广州大学;2016年
7 徐帆;笼养食蟹猴自发抑郁模型的创建与验证[D];重庆医科大学;2015年
8 毕仁贵;考虑相关性的不确定凸集模型与非概率可靠性分析方法[D];湖南大学;2015年
9 卢伟;小时步长森林碳循环模型(BEPS)参数优化及应用研究[D];东北林业大学;2016年
10 周作建;移动云环境下服务推荐模型及关键技术研究[D];南京大学;2016年
相关硕士学位论文 前10条
1 朱嘉蕊;基于科技接受模型的云出版服务模式研究[D];武汉理工大学;2014年
2 李昂;BIM技术在工程建设项目中模型创建和碰撞检测的应用研究[D];东北林业大学;2015年
3 顾慧燕;预测有机碳-水分配系数pp-LFERs模型的改进研究[D];中国地质大学(北京);2015年
4 马豪;卫生管理决策支持系统的模型构建研究[D];北京协和医学院;2015年
5 王海波;基于GARCH模型的沪深300指数收益率的波动性研究[D];西安建筑科技大学;2015年
6 郭滨;基于Kriging与改进灰色组合模型的边坡变形分析研究[D];江西理工大学;2015年
7 邢立雯;CEV模型最优参数的实证研究[D];山东大学;2015年
8 王泽森;基于Ⅳ级动态逸度模型京津冀地区硫的多介质迁移转化[D];华北电力大学;2015年
9 李欢;大规模网络零模型的高效量化评估策略研究[D];北京化工大学;2015年
10 薛文旅;小学数学《方程》单元教学中渗透模型思想的研究[D];南京师范大学;2015年
,本文编号:1790327
本文链接:https://www.wllwen.com/shoufeilunwen/xxkjbs/1790327.html