针对DQN在路径规划应用中的对抗性样本生成及预测研究
【学位单位】:北京交通大学
【学位级别】:硕士
【学位年份】:2019
【中图分类】:TP18
【部分图文】:
点)的情况下,借助算法能够使智能体自动算出运动路径从而实现自主寻路的过??程。也就是说,智能体依据某个优化原则在寻路过程中避开障碍物找到一条从起??点到终点的最优最短路径。如图1-1所示,为路径规划模型的框架图。??6??
生成及预测研究。??1.4论文结构安排??本文一共分为六章。文章的结构及研究内容如图1-2所示。??研究对象?研究目标??AI强化学习系统对抗?对抗样本生成及预测??的:?对抗样本类:議两类職性??强化,法:?:型及特征:样賴测1??V-? ̄? ̄? ̄??研究内容??(?基于DQN算法的路径规划??f?……?、??/?对抗样本生成与构建1/基于WAG算法的对\??I基子白盒的对抗样本生成^?抗样本预测模型;??\v?算法(WAG)?八?(APM)?:j??/一一-:?「?'??jg?仿真实验构建及模型性能评估??''^^KJUW,?■???????—??图1-2研究内容框架图??Figure?1-2?Frame?diagram?of?research?content??为了更好的梳理文章的研究内容,现将文章的结构和安排介绍如下:??论文的第一章为引言部分。在本章中我们简要介绍了基于深度强化学习的相??关研究背景,课题的研究目的、意义及将深度强化学习应用于路径规划场景下的创??新意义。分析了国内外相关研究领域,按照不同的类型接介绍了最具代表性的几种??强化学习算法。简要介绍了深度强化学习在路径规划问题上的研究现状及应用。并??给出论文的预期研究成果与结构安排。??论文的第二章为理论基础与背景知识。在本章中我们介绍了深度强化学习的??9??
层是一个5x5x3的过滤器,过滤器的深度与输入图像的深度相同,过滤器从顶端??开始依次扫过图像,并与输入图像进行卷积得到一个32x32x1的特征图。这样,??通过卷积层可以得到更深层次的特征图。如图2-1所示是卷积神经网络的概念示范??图,其中C层为特征提取层,S层为特征映射层。输入图像通过三个过滤器和可加??偏执进行卷积,通过C1层会产生三个特征映射图,通过一个Sigmoid函数可以得??到三个S2层的特征映射图,再经过过滤器得到C3层,再通过Sigmoid函数得到??S4,这样多次迭代这些像素值被光栅化,并连接成一个向量输入到传统的神经网??络,得到输出。??池化层是对通过卷积层得到的特征图进行压缩,使特征图变小,参数减小来简??化网络计算的复杂度。它一般有两种方法,一种是最大池化另一种是平均池化。最??大池化是在特征图中的每一个区域中寻找像素最大值
【相似文献】
相关期刊论文 前10条
1 乔鑫伟;;百姓的粮仓[J];数据;2013年08期
2 丁卫平;李越;仲庆国;;创新调查实施模式 提高直接调查能力——泰州调查队推行调查样本点直接管理工作的思考与实践[J];中国统计;2010年11期
3 曾昭贤;张茂军;王炜;熊志辉;;基于样本点能量扩散模型的聚类[J];计算机应用;2011年09期
4 欧阳资生;吴喜之;;修正的Pickands估计样本点分割的自助估计方法[J];应用数学学报;2006年02期
5 李荣江;;计算古典概率的若干简化方法[J];数理医药学杂志;2008年05期
6 王少波,柴艳丽,梁醒培;神经网络学习样本点的选取方法比较[J];郑州大学学报(工学版);2003年01期
7 蒋友宝;黄星星;廖国宇;张建仁;;基于多线性支持向量机的样本点正确分类与复杂失效方程稳步模拟[J];计算力学学报;2015年03期
8 梁路;龚奔龙;黎剑;滕少华;;一种缓解分类面交错的样本点扩散方法[J];计算机科学;2017年09期
9 肖海峰;德国的农产量特别调查[J];北京统计;1997年05期
10 李大伟;吕震宙;张磊刚;;基于优化样本点的双重Kriging模型的重要性测度求解方法[J];西北工业大学学报;2014年02期
相关博士学位论文 前2条
1 常海超;近似理论在船型优化中的应用研究[D];武汉理工大学;2014年
2 朱宝;虚拟样本生成技术及建模应用研究[D];北京化工大学;2017年
相关硕士学位论文 前10条
1 白肖璇;针对DQN在路径规划应用中的对抗性样本生成及预测研究[D];北京交通大学;2019年
2 赵林杰;基于多响应面方法的结构失效模式识别与可靠度分析[D];长沙理工大学;2018年
3 王伟文;拉普拉斯特征映射新增样本点问题及正则化降维研究[D];暨南大学;2017年
4 胡秀英;基于噪声样本点的曲线、曲面重构[D];天津大学;2008年
5 闫阳;结构可靠性分析的数值模拟方法研究[D];清华大学;2012年
6 彭晓琳;基于闭包的分类判别方法研究[D];武汉理工大学;2008年
7 于光华;基于样本选择的复杂分类问题研究[D];天津大学;2017年
8 万韩永;基于样本重要性原理的KNN文本分类算法[D];江西师范大学;2015年
9 许翠云;模糊支持向量机的研究及其在基因分类中的应用[D];南京林业大学;2013年
10 周永磊;基于Side-Information的若干学习问题研究[D];清华大学;2005年
本文编号:2841218
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2841218.html