基于Q学习算法和遗传算法的动态环境路径规划
本文关键词:基于Q学习算法和遗传算法的动态环境路径规划 出处:《北京工业大学学报》2017年07期 论文类型:期刊论文
【摘要】:针对Q学习算法在动态连续环境中应用时因状态连续、数量过多,导致Q值表出现存储空间不足和维数灾的问题,提出了一种新的Q值表设计方法,并设计了适用于连续环境的R值和动作.不同于以状态-动作为索引,将时间离散化为时刻,以时刻-动作为索引来建立Q值表.将在某状态应选择某一动作的问题转化为在某时刻应选择某一动作的问题,实现了Q学习算法在动态连续环境中的应用.采用了先利用遗传算法进行静态全局路径规划,然后利用Q学习算法进行动态避障.整个方法为一种先"离线"后"在线"的分层路径规划方法,成功实现了移动机器人的路径规划.仿真结果验证了所提出方法的有效性.
[Abstract]:This paper presents a new Q - value table design method for Q - learning algorithm in dynamic continuous environment . A new Q - value table design method is put forward .
【作者单位】: 北京工业大学信息学部;北京工业大学计算智能与智能系统北京重点实验室;
【基金】:国家自然科学基金资助项目(61573029) 北京市自然科学基金资助项目(4162012) 北京工业大学“智能制造领域大科研推进计划”资助项目
【分类号】:TP18;TP242
【正文快照】: 2.北京工业大学计算智能与智能系统北京重点实验室,北京100124)路径规划技术是机器人技术中的基础问题[1].静态环境下的机器人路径规划相对简单,但在环境时刻变化的动态环境中,原有的静态环境路径规划方法却不能很好地完成指定任务.在动态环境中需要根据传感器获得的实时环境
【参考文献】
相关期刊论文 前8条
1 于莹莹;陈燕;李桃迎;;改进的遗传算法求解旅行商问题[J];控制与决策;2014年08期
2 金敏;鲁华祥;;一种遗传算法与粒子群优化的多子群分层混合算法[J];控制理论与应用;2013年10期
3 方敏;李浩;;基于状态回溯代价分析的启发式Q学习[J];模式识别与人工智能;2013年09期
4 张国亮;;动态环境中移动机器人路径规划研究综述[J];机床与液压;2013年01期
5 柳长安;鄢小虎;刘春阳;吴华;;基于改进蚁群算法的移动机器人动态路径规划方法[J];电子学报;2011年05期
6 朱大奇;颜明重;;移动机器人路径规划技术综述[J];控制与决策;2010年07期
7 朴松昊,洪炳熔;一种动态环境下移动机器人的路径规划方法[J];机器人;2003年01期
8 张纯刚,席裕庚;动态未知环境中移动机器人的滚动路径规划[J];机器人;2002年01期
相关硕士学位论文 前1条
1 柯星;动态环境下多移动机器人路径规划研究[D];电子科技大学;2013年
【共引文献】
相关期刊论文 前10条
1 梁肖;周湘贞;;基于遗传算法的小麦收割机路径智能优化控制研究[J];农机化研究;2018年02期
2 韩明;刘教民;吴朔媚;王敬涛;;粒子群优化的移动机器人路径规划算法[J];计算机应用;2017年08期
3 陈顺立;;农业机器人路径优化及轨迹跟踪研究—基于遗传算法[J];农机化研究;2017年08期
4 许明乐;游晓明;刘升;;基于统计分析的自适应蚁群算法及应用[J];计算机应用与软件;2017年07期
5 刘乐柱;肖长诗;文元桥;;基于Dubins路径的无人艇运动规划算法[J];计算机应用;2017年07期
6 强宁;高洁;康凤举;;基于PSO和三次样条插值的多机器人全局路径规划[J];系统仿真学报;2017年07期
7 孙兆阳;邓晓刚;;基于信息融合蚁群算法的机器人路径规划[J];工业控制计算机;2017年06期
8 于丽;;基于改进K近邻算法的网络舆情技术研究[J];自动化与仪器仪表;2017年06期
9 肖怀硕;李清泉;施亚林;张同乔;张纪伟;;灰色理论 变分模态分解和NSGA-Ⅱ优化的支持向量机在变压器油中气体预测中的应用[J];中国电机工程学报;2017年12期
10 俞亚杰;罗印升;宋伟;;一种改进的非完整轮式移动机器人轨迹跟踪控制方法[J];机床与液压;2017年11期
相关硕士学位论文 前10条
1 赵珍;基于改进蚁群算法的多机器人路径规划研究[D];兰州理工大学;2016年
2 于清平;基于ARM平台的多机器人路径规划系统研究[D];上海工程技术大学;2016年
3 周文明;基于智能算法的移动机器人路径规划研究[D];南京理工大学;2016年
4 卢路秋;基于模糊人工势场法的多移动机器人路径规划研究[D];天津工业大学;2016年
5 斯衡;基于星空定位的家庭服务机器人研究与开发[D];浙江大学;2015年
6 王维;基于多智能体系统的多机器人路径规划方法研究及应用[D];电子科技大学;2015年
7 黄英杰;基于视觉的多机器人协同控制研究[D];济南大学;2015年
8 徐小根;基于Kinect机器人导航系统设计[D];南京邮电大学;2015年
9 朱莹莹;基于混合粒子群算法的移动机器人路径规划研究[D];上海工程技术大学;2015年
10 袁德宇;类人猿机器人复杂地貌下路径搜索与全方位步行研究[D];哈尔滨工业大学;2014年
【二级参考文献】
相关期刊论文 前10条
1 任海艳;陈飞翔;;自适应遗传算法的改进及在曲线化简中的应用[J];计算机工程与应用;2012年11期
2 刘全;傅启明;龚声蓉;伏玉琛;崔志明;;最小状态变元平均奖赏的强化学习方法[J];通信学报;2011年01期
3 孙立博;刘艳;孙济洲;倪慧;;基于混合感知信息的路径规划模型[J];计算机工程;2010年10期
4 刘朝华;张英杰;章兢;吴建辉;;蚁群算法与免疫算法的融合及其在TSP中的应用[J];控制与决策;2010年05期
5 邓万宇;郑庆华;陈琳;许学斌;;神经网络极速学习方法研究[J];计算机学报;2010年02期
6 冀俊忠;黄振;刘椿年;;一种快速求解旅行商问题的蚁群算法[J];计算机研究与发展;2009年06期
7 禹建丽;程思雅;孙增圻;Kroumov V;;一种移动机器人三维路径规划优化算法[J];中南大学学报(自然科学版);2009年02期
8 谢敬;傅卫平;李德信;杨静;;动态环境下基于行为动力学的移动机器人路径规划[J];西安理工大学学报;2008年04期
9 徐玉如;姚耀中;;考虑海流影响的水下机器人全局路径规划研究[J];中国造船;2008年04期
10 马卫;朱庆保;;求解函数优化问题的快速连续蚁群算法[J];电子学报;2008年11期
相关硕士学位论文 前3条
1 梁文君;机器人动态路径规划与协作路径规划研究[D];浙江大学;2010年
2 张晨旭;多agent机器人系统导航及路径规划的研究[D];中北大学;2009年
3 李静;多移动机器人路径规划避碰和协调研究[D];上海交通大学;2007年
【相似文献】
相关期刊论文 前10条
1 王兴成,郑紫微,贾欣乐;模糊遗传算法及其应用研究[J];计算技术与自动化;2000年02期
2 吴瑞镛,徐大纹;具有年龄结构的遗传算法[J];桂林电子工业学院学报;2001年04期
3 杨艳丽,史维祥;一种新的优化算法—遗传算法的设计[J];液压气动与密封;2001年02期
4 杨宜康,李雪,彭勤科,黄永宣;具有年龄结构的遗传算法[J];计算机工程与应用;2002年11期
5 谷峰,吴勇,唐俊;遗传算法的改进[J];微机发展;2003年06期
6 ;遗传算法[J];计算机教育;2004年10期
7 赵义红,李正文,何其四;生物信息处理系统遗传算法探讨[J];成都理工大学学报(自然科学版);2004年05期
8 刘坤,刘伟波,吴忠强;基于模糊遗传算法的电液位置伺服系统控制[J];黑龙江科技学院学报;2005年04期
9 张英俐,刘弘 ,马金刚;遗传算法作曲系统研究[J];信息技术与信息化;2005年05期
10 丁发智;;浅谈遗传算法[J];乌鲁木齐成人教育学院学报;2005年04期
相关会议论文 前10条
1 陈家照;廖海涛;张中位;罗寅生;;一种改进的遗传算法及其在路径规划中的应用[A];2009系统仿真技术及其应用学术会议论文集[C];2009年
2 任燕翔;姜立;刘连民;从滋庆;;改进遗传算法在三维日照方案优化中的应用[A];工程三维模型与虚拟现实表现——第二届工程建设计算机应用创新论坛论文集[C];2009年
3 韩娟;;遗传算法概述[A];第三届河南省汽车工程科技学术研讨会论文集[C];2006年
4 庞国仲;王元西;;基于遗传算法控制步长的定性仿真方法[A];'2000系统仿真技术及其应用学术交流会论文集[C];2000年
5 张忠华;杨淑莹;;基于遗传算法的聚类设计[A];全国第二届信号处理与应用学术会议专刊[C];2008年
6 靳开岩;张乃尧;;几种实用遗传算法及其比较[A];1996年中国智能自动化学术会议论文集(下册)[C];1996年
7 王宏刚;曾建潮;李志宏;;摄动遗传算法[A];1996年中国智能自动化学术会议论文集(下册)[C];1996年
8 彭宏;欧庆铃;欧永斌;;具有退火选择的遗传算法的收敛速度估计[A];1998年中国智能自动化学术会议论文集(下册)[C];1998年
9 林家恒;李国锋;田国会;刘长有;;遗传算法在旋转货架拣选优化中的应用[A];1996中国控制与决策学术年会论文集[C];1996年
10 冯春;谢泗淮;张怡;;解两层决策问题的一个遗传算法[A];1996中国控制与决策学术年会论文集[C];1996年
相关博士学位论文 前10条
1 李险峰;基于改进遗传算法的汽车装配生产线平衡问题研究[D];北京科技大学;2017年
2 周辉仁;递阶遗传算法理论及其应用研究[D];天津大学;2008年
3 郝国生;交互式遗传算法中用户的认知规律及其应用[D];中国矿业大学;2009年
4 侯格贤;遗传算法及其在跟踪系统中的应用研究[D];西安电子科技大学;1998年
5 马国田;遗传算法及其在电磁工程中的应用[D];西安电子科技大学;1998年
6 袁丽华;基于物种进化的遗传算法研究[D];南京航空航天大学;2009年
7 李航;遗传算法求解多模态优化问题的研究[D];天津大学;2007年
8 石玉;提高实数遗传算法数值优化效率的研究[D];南京航空航天大学;2002年
9 明亮;遗传算法的模式理论及收敛理论[D];西安电子科技大学;2006年
10 姚志红;多元共生遗传算法研究及其在藻类智能模式识别中的应用[D];上海大学;2007年
相关硕士学位论文 前10条
1 钟海萍;原对偶遗传算法与蚁群算法的一种融合算法[D];暨南大学;2013年
2 李志添;模糊遗传算法与资源优化配置的预测控制[D];华南理工大学;2015年
3 彭骞;基于遗传算法的山区高等级公路纵断面智能优化方法研究[D];昆明理工大学;2015年
4 郭颂;基于粗糙集和遗传算法的数字管道生产管理系统研究[D];昆明理工大学;2015年
5 吴南;数值逼近遗传算法的研究应用[D];华南理工大学;2015年
6 于光帅;一类优化算法的改进研究与应用[D];渤海大学;2015年
7 吴欣欣;改进GA-TS算法优化的BP神经网络入侵检测研究[D];湖南工业大学;2015年
8 宋光兵;基于遗传算法的C烟厂AGV路径规划研究[D];昆明理工大学;2015年
9 唐泽;基于FPGA的遗传算法在交通控制中的应用[D];西南交通大学;2015年
10 王金玉;打孔机效能优化模型[D];华中师范大学;2015年
,本文编号:1378055
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/1378055.html