基于生物视觉机制的视频显著目标检测算法研究
发布时间:2021-11-20 05:41
随着计算机科学及其人工智能的高速发展,计算机视觉领域的研究工作迈向了一个空前火热的高潮。相比于人类视觉系统对外界信息的优秀的处理机制,计算机还远远不足以与之相比。因此,通过对人类以及动物的视觉系统的不断实验研究,计算机视觉领域的专家们在最近几十年提出了大量的计算机模型。同时,随着智能监控,智能机器人,无人机导航等飞速发展,针对图像和视频中的基于目标的分析和研究工作具有巨大的价值。本文分析研究了生物视觉注意机制的计算模型,提出了基于生物视觉机制的视频运动目标以及显著目标检测算法。本文的主要工作如下。第一,研究发现飞行昆虫由于复眼构造特殊,利用光流来控制自身的各种飞行行为,模仿飞行昆虫视觉机理的基于光流的计算机视觉算法成为当前研究热点。因此,在本文第三章中我们提出了一种改进的光流法计算视频序列中运动目标的算法。首先,我们提出了一种时空梯度定义来指导对比度计算,它可以在前景目标周围分配高的显著值,同时避免了难以克服的空洞效应。其次,我们根据运动梯度的幅度值的比较,来自适应的融合时间梯度和空间梯度信息。最后,我们在超像素的水平上计算平均光流直方图,通过超像素块间的运动信息的对比计算来提取运动目...
【文章来源】:电子科技大学四川省 211工程院校 985工程院校 教育部直属院校
【文章页数】:71 页
【学位级别】:硕士
【部分图文】:
人类视觉系统的视觉通路眼睛视神经外侧膝状体视皮层
电子科技大学硕士学位论文10图2-1人类视觉系统的视觉通路眼睛作为视觉系统的前端,接收外部的视觉刺激即光信号,并在眼底视网膜形成光学影像,同时,视网膜将光学影像转变为神经信号,以神经信号的形式通过视觉神经传入大脑的视觉中枢进行更高级的处理和分析,使得灵长类动物包括人类都具有视觉认知能力。自从上世界末期,随着计算机硬件和软件技术的快速提高,及生物神经科学的蓬勃发展,科学家们能够定性、定量地对眼睛和大脑中视网膜、脑皮层等这些重要的视觉认知部位的各个区域,从生理结构到功能特点进行深入的科学实验和分析。经过多年不懈努力,研究者们不仅发现了视觉信息通路,而且也了解了视皮层的每个子区域的功能特征,并根据视觉系统的形成过程,将视觉信息处理分为视网膜阶段、早期视觉信息处理阶段和中后期视觉信息处理阶段,这个模型框架被应用到很多机器计算模型中[44]。从低层视觉信息到高级视觉信息处理框架如图2-2所示。图2-2视觉信息处理的一般框架[44]眼睛视神经外侧膝状体视皮层
第二章视觉系统的生理基础及其理论模型11图2-3大脑的两条视觉通路[45]2.2.2大脑的视觉通路简介1983年,Mishkin和Ungerleider等人根据对猴子的大脑损伤研究,首次提出视觉平行加工理论[46],认为灵长类动物的视觉系统中存在两个信息流,一个是腹侧流(VentralStream),一个是背侧流(DorsalStream),具体结构如图2-3所示。这两个信息流对应着两条视觉通路。一条视觉通路(腹侧流)将从视网膜上接收到的视觉信号转变为神经信号,沿腹侧传递到膝状体(LGN),再到初级视皮层区域(V1,V2,V4)、下颞叶皮层(IT),最终视觉神经信号到达腹外侧额叶前部皮层,这条通路往往被认为是“内容通路”(WhatPathway),用来进行形状、颜色等静态特征检测,并在目标识别中发挥作用,而且人类大脑的长期记忆也和该通路有关。另一条视觉通路(背侧流),也是从视网膜开始,将视觉神经信号沿背部传递到侧膝体(LGN),再经过初级视皮层区域(V1,V2)、中颞叶区(MT或V5)、后顶叶皮层(PPC),最终视觉神经信号到达背外侧额叶前部皮层,这条通路通常简称为“空间通路”(WherePathway),用来处理空间中位置、动作及其他和空间有关的信息[44]。腹侧通路和背侧通路的视觉信号,最终在前额叶皮层(FEF)交汇,然后传递到上丘(SC)等与控制眼球运动有关的大脑区域,从而引发选择性注意。两条视觉通路的信息流如图2-4所示。从行为经验看,知觉过程中what通路和where通路总是伴随出现、联系在一块的(同时激活)。腹侧流(what通路)感知机制的关键贡献是识别可能的和实际的目标对象,并选择适当的行为路线来处理这些对象。但是这个动作的后续实现是背侧流(where通路)的工作。Where通路在选择目标对象时不起任何作用,背侧流腹侧流
【参考文献】:
博士论文
[1]基于视觉认知理论的视频目标检测及分割研究[D]. 涂铮铮.安徽大学 2015
硕士论文
[1]基于时空特征的视觉显著性检测方法研究[D]. 冯思琴.重庆邮电大学 2019
本文编号:3506685
【文章来源】:电子科技大学四川省 211工程院校 985工程院校 教育部直属院校
【文章页数】:71 页
【学位级别】:硕士
【部分图文】:
人类视觉系统的视觉通路眼睛视神经外侧膝状体视皮层
电子科技大学硕士学位论文10图2-1人类视觉系统的视觉通路眼睛作为视觉系统的前端,接收外部的视觉刺激即光信号,并在眼底视网膜形成光学影像,同时,视网膜将光学影像转变为神经信号,以神经信号的形式通过视觉神经传入大脑的视觉中枢进行更高级的处理和分析,使得灵长类动物包括人类都具有视觉认知能力。自从上世界末期,随着计算机硬件和软件技术的快速提高,及生物神经科学的蓬勃发展,科学家们能够定性、定量地对眼睛和大脑中视网膜、脑皮层等这些重要的视觉认知部位的各个区域,从生理结构到功能特点进行深入的科学实验和分析。经过多年不懈努力,研究者们不仅发现了视觉信息通路,而且也了解了视皮层的每个子区域的功能特征,并根据视觉系统的形成过程,将视觉信息处理分为视网膜阶段、早期视觉信息处理阶段和中后期视觉信息处理阶段,这个模型框架被应用到很多机器计算模型中[44]。从低层视觉信息到高级视觉信息处理框架如图2-2所示。图2-2视觉信息处理的一般框架[44]眼睛视神经外侧膝状体视皮层
第二章视觉系统的生理基础及其理论模型11图2-3大脑的两条视觉通路[45]2.2.2大脑的视觉通路简介1983年,Mishkin和Ungerleider等人根据对猴子的大脑损伤研究,首次提出视觉平行加工理论[46],认为灵长类动物的视觉系统中存在两个信息流,一个是腹侧流(VentralStream),一个是背侧流(DorsalStream),具体结构如图2-3所示。这两个信息流对应着两条视觉通路。一条视觉通路(腹侧流)将从视网膜上接收到的视觉信号转变为神经信号,沿腹侧传递到膝状体(LGN),再到初级视皮层区域(V1,V2,V4)、下颞叶皮层(IT),最终视觉神经信号到达腹外侧额叶前部皮层,这条通路往往被认为是“内容通路”(WhatPathway),用来进行形状、颜色等静态特征检测,并在目标识别中发挥作用,而且人类大脑的长期记忆也和该通路有关。另一条视觉通路(背侧流),也是从视网膜开始,将视觉神经信号沿背部传递到侧膝体(LGN),再经过初级视皮层区域(V1,V2)、中颞叶区(MT或V5)、后顶叶皮层(PPC),最终视觉神经信号到达背外侧额叶前部皮层,这条通路通常简称为“空间通路”(WherePathway),用来处理空间中位置、动作及其他和空间有关的信息[44]。腹侧通路和背侧通路的视觉信号,最终在前额叶皮层(FEF)交汇,然后传递到上丘(SC)等与控制眼球运动有关的大脑区域,从而引发选择性注意。两条视觉通路的信息流如图2-4所示。从行为经验看,知觉过程中what通路和where通路总是伴随出现、联系在一块的(同时激活)。腹侧流(what通路)感知机制的关键贡献是识别可能的和实际的目标对象,并选择适当的行为路线来处理这些对象。但是这个动作的后续实现是背侧流(where通路)的工作。Where通路在选择目标对象时不起任何作用,背侧流腹侧流
【参考文献】:
博士论文
[1]基于视觉认知理论的视频目标检测及分割研究[D]. 涂铮铮.安徽大学 2015
硕士论文
[1]基于时空特征的视觉显著性检测方法研究[D]. 冯思琴.重庆邮电大学 2019
本文编号:3506685
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3506685.html
最近更新
教材专著