视频导航中的地图生成、障碍检测与行人人脸识别
发布时间:2020-12-26 15:30
随着人工智能的发展,越来越多的智能设备如机器人能够在各种场景代替人类工作。在安防领域,很多场景需要安防人员进行巡逻,其中存在工作量大、危险性高等问题。这类情况下,使用机器人或无人车进行巡逻无疑将是更好的选择。因此,研究自主巡逻的机器人或无人车一直是人工智能领域的一大研究热点。视频导航,作为自主巡逻中的一种有效且常用的导航方法,是当前研究的一大热点。本文将针对视频导航中存在的若干问题展开研究,主要有:室内导航中的地图建立与自我定位、室外导航中的障碍物检测以及导航过程中可疑行人人脸的检测与识别等。本文的主要研究工作与创新如下:1.针对室内导航常用的设定路标和导轨方法难于实施,适应能力不强的问题,提出了一种快速易实施的基于引导人地图生成与自然路标选取的室内导航方法。该方法利用视频帧差法以及颜色信息,检测出引导人所在的位置,跟随引导人行走并记录路径,同时在行走过程中记录自然场景作为路标,从而形成拓扑地图,地图建立后可以在此基础上实现自主巡逻。由于不需要提前设定路标和导轨,所以易于实施,适应性强。实验结果表明,该方法在会议室、办公室以及实验室等复杂环境下平均导航成功率能够达到91.5%。2.针对...
【文章来源】:中国科学技术大学安徽省 211工程院校 985工程院校
【文章页数】:126 页
【学位级别】:博士
【部分图文】:
谷歌无人车在人类所获取的外界信息中,绝大部分是通过眼睛获取的,也就是视觉信息
2.4.1 训练方式深度学习的训练方式可以分为两步(如图2.1所示):预训练与微调(fine-tune )。预训练,即为自下而上的非监督学习,这一步是与传统浅层神经网络最大的区别。用逐层训练的方法,每次只学习一层的参数,学习下一层参数的时候这一层参数固定。微调,即为自上而下的监督学习这一步类似于传统神经网络的反向传播(BP:Back Propagation)过程。利用带标签的数据,对误差进行反向传播,对所有层的网络参数进行一次性调整。由于最后只是进行一次性微调,所以深度学习效果好坏在很大程度上主要依靠第一步的预训练过程。输出层预 ⑩? 微越隐层^CTO QO 0\ —?八 J输入层图2.1深度网络的训练过程2.4.2 模型架构目前常见的深度学习模型有很多,基本上可以分为两大类:判别模型和概率生成模型。其中判别模型与传统的神经网络方法一致,层间利用判别准则连接。而概率生成模型则通过概率准则来连接各层。最常见的判别模型主要有两种:栈式自编码器(SAE: Stack Auto Encoder)模型与卷积神经网络CNN。自编码器(AE: Auto Encoder)最早出现在20世纪80年代[164]
Pooling)层,每个卷积层有不同的卷积核大小,并产生不同的特征图数量,后面为全连接层。当然,除了这两种常见的判别模型,最近也出现了很多其他的基于判别模式的模型,例如在SAE基础上改进的栈式降噪自编码器SDAE (Stack Denoising Auto Encoder)[丨68],基于 PCA 的 PCANet[丨69]等。
【参考文献】:
期刊论文
[1]海云协同环境下服务运营环境关键技术的探讨[J]. 马斌,冯波. 网络新媒体技术. 2014(06)
[2]海云计算实验系统研究[J]. 詹剑锋,明子鉴,王磊,徐俊刚,陈兴振,张峰,张立新,孙凝晖. 网络新媒体技术. 2012(06)
[3]海云创新试验环境管控与服务系统总体设计[J]. 葛敬国,唐海娜,鄂跃鹏,李佟. 网络新媒体技术. 2012(06)
本文编号:2939970
【文章来源】:中国科学技术大学安徽省 211工程院校 985工程院校
【文章页数】:126 页
【学位级别】:博士
【部分图文】:
谷歌无人车在人类所获取的外界信息中,绝大部分是通过眼睛获取的,也就是视觉信息
2.4.1 训练方式深度学习的训练方式可以分为两步(如图2.1所示):预训练与微调(fine-tune )。预训练,即为自下而上的非监督学习,这一步是与传统浅层神经网络最大的区别。用逐层训练的方法,每次只学习一层的参数,学习下一层参数的时候这一层参数固定。微调,即为自上而下的监督学习这一步类似于传统神经网络的反向传播(BP:Back Propagation)过程。利用带标签的数据,对误差进行反向传播,对所有层的网络参数进行一次性调整。由于最后只是进行一次性微调,所以深度学习效果好坏在很大程度上主要依靠第一步的预训练过程。输出层预 ⑩? 微越隐层^CTO QO 0\ —?八 J输入层图2.1深度网络的训练过程2.4.2 模型架构目前常见的深度学习模型有很多,基本上可以分为两大类:判别模型和概率生成模型。其中判别模型与传统的神经网络方法一致,层间利用判别准则连接。而概率生成模型则通过概率准则来连接各层。最常见的判别模型主要有两种:栈式自编码器(SAE: Stack Auto Encoder)模型与卷积神经网络CNN。自编码器(AE: Auto Encoder)最早出现在20世纪80年代[164]
Pooling)层,每个卷积层有不同的卷积核大小,并产生不同的特征图数量,后面为全连接层。当然,除了这两种常见的判别模型,最近也出现了很多其他的基于判别模式的模型,例如在SAE基础上改进的栈式降噪自编码器SDAE (Stack Denoising Auto Encoder)[丨68],基于 PCA 的 PCANet[丨69]等。
【参考文献】:
期刊论文
[1]海云协同环境下服务运营环境关键技术的探讨[J]. 马斌,冯波. 网络新媒体技术. 2014(06)
[2]海云计算实验系统研究[J]. 詹剑锋,明子鉴,王磊,徐俊刚,陈兴振,张峰,张立新,孙凝晖. 网络新媒体技术. 2012(06)
[3]海云创新试验环境管控与服务系统总体设计[J]. 葛敬国,唐海娜,鄂跃鹏,李佟. 网络新媒体技术. 2012(06)
本文编号:2939970
本文链接:https://www.wllwen.com/shoufeilunwen/xxkjbs/2939970.html