基于深度强化学习的主动人脸感知技术研究
本文选题:服务机器人 + 主动人脸感知 ; 参考:《山东大学》2017年硕士论文
【摘要】:服务机器人是机器人行业重要的一个研究方向。近几年,面向教育、医疗、家居等行业的服务机器人在市场上涌现,但是当前服务机器人行业普遍没有得到用户的良好反应,其主要原因在于技术积淀不足,很多技术问题尚未解决。例如服务机器人为了和人进行友好的交互,一般需要服务机器人的感知器能够主动对准人脸,实现面对面交流的效果。然而现有的方法只能在人脸已经进入机器人视野后,机器人才能意识到已经有人出现,不能通过人的其他身体部位进行判断。另外,服务机器人的陌生人报警和面向不同用户进行个性化交流的功能,都需要机器人进行人脸识别,这就要求机器人能够主动感知人脸所在位置。这样不仅能够在感官上提升人和机器人的交互体验,更是正确识别不同人身份信息的重要条件。在现有的技术方案中,通常需要人配合机器人,自主移动到机器人的视野中,然而在大部分情况下,人只是走进了机器人的视野,机器人却没有或者很难感知到完整的人脸信息。如何让机器人主动的进行人脸感知,并通过调整自身姿态来获取更多有用的信息,这个问题就是本课题着重解决的问题。针对上文所提出的问题,我们希望通过训练得到一个决策网络,该网络能够根据当前机器人所获得的信息推断目标位置并执行相关动作。这一过程被定义为主动人脸感知问题。主动人脸感知问题可以建模为马尔可夫决策过程,从而采用深度强化学习算法训练智能体完成主动人脸感知任务。本文基于深度强化学习算法,实现了主动人脸感知,完成的工作可以分为以下几个方面:1、介绍了主动人脸感知问题的研究现状,通过分析国内外的研究成果,结合服务机器人的实际情况,归纳出本文所解决的问题:在人脸未进入机器人视野的情况下,如何主动寻找人脸。通过对强化学习、深度学习和深度强化学习的理论研究,本文提出了一种采用深度强化学习算法进行主动人脸感知的方法。2、详细介绍了深度强化学习的基础算法深度学习和强化学习,在总结他们的算法原理和优缺点的基础上,概况了深度强化学习在解决主动人脸感知问题中的优势。3、将主动人脸感知问题建模为马尔可夫过程。从理论上论证,本课题提出的深度强化学习方法能够训练策略网络来解决人脸感知问题。4、由于在实际场景中验证算法会花费大量的人力物力,本工作先构建了一个仿真的实验场景。在仿真场景中对算法进行验证,确保算法可行性的基础上,再将算法移植到实际场景中进行验证。5、本文把深度强化学习算法应用在实际的场景中。采用一个主动相机来模拟服务机器人,训练机器人在只看到人脚的时候,能够主动地寻找到人脸。通过实验验证,本文提出的方法有效地解决了主动人脸感知问题,通过仿真和离线两种训练方式,有效的推动了主动人脸感知技术在实际场景中的应用。
[Abstract]:Service robot is an important research direction in robot industry. In recent years, service robots for education, medical, home and other industries have emerged in the market, but the current service robot industry has generally failed to get a good response from users. The main reason is that the technology accumulation is insufficient. Many technical problems remain unresolved. For example, in order to conduct friendly interaction with people, service robots usually need the sensor of service robots to be able to actively target the face and realize the effect of face to face communication. However, the existing methods only after the human face has entered the robot field of vision, the robot can realize that someone has appeared, can not be judged by other parts of the human body. In addition, the functions of strangers alarm and personalized communication for different users require robot face recognition, which requires the robot to actively perceive the location of the face. This not only can enhance the interaction experience between human and robot in sense, but also is an important condition to correctly identify the identity information of different people. In the existing technical scheme, people are usually required to cooperate with the robot and move autonomously into the robot's field of vision. However, in most cases, people just walk into the field of vision of the robot. But the robot has no or very difficult to perceive the complete face information. How to make the robot active face perception and adjust its own posture to obtain more useful information, this problem is the focus of this topic. In order to solve the above problems, we hope to obtain a decision network through training, which can infer the position of the target and perform related actions based on the information obtained by the current robot. This process is defined as an active face perception problem. The active face perception problem can be modeled as a Markov decision process, and then the agent can be trained to accomplish the task of active face perception by using the depth reinforcement learning algorithm. Based on the deep reinforcement learning algorithm, the active face perception is realized in this paper. The work can be divided into the following aspects: 1. This paper introduces the research status of active face perception, and analyzes the research results at home and abroad. Combined with the actual situation of the service robot, the problem that this paper solves is summarized: how to find the human face actively without entering the robot field of vision. Through the theoretical research of intensive learning, deep learning and deep reinforcement learning, In this paper, a method of active face perception using depth reinforcement learning algorithm is proposed. The basic algorithm of depth reinforcement learning and reinforcement learning are introduced in detail. The principle, advantages and disadvantages of these algorithms are summarized. The advantage of deep reinforcement learning in solving active face perception problem is summarized, and the active face perception problem is modeled as Markov process. It is proved theoretically that the depth reinforcement learning method proposed in this paper can train the strategy network to solve the face perception problem .4. because it takes a lot of manpower and material resources to verify the algorithm in the actual scene. In this paper, a simulation experiment scene is constructed. On the basis of verifying the algorithm in the simulation scene and ensuring the feasibility of the algorithm, the algorithm is transplanted to the actual scene to verify .5. this paper applies the depth reinforcement learning algorithm to the actual scene. An active camera is used to simulate the service robot, and the robot is trained to find the human face actively when it sees only the human foot. The experimental results show that the proposed method can effectively solve the problem of active face perception and promote the application of active face perception technology in the actual scene effectively through simulation and offline training.
【学位授予单位】:山东大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP242;TP18
【相似文献】
相关期刊论文 前10条
1 蔡鹤皋;机器人将是21世纪技术发展的热点[J];中国机械工程;2000年Z1期
2 ;世界机器人最新统计数据[J];机器人技术与应用;2000年01期
3 ;警卫和保洁两用机器人[J];机器人技术与应用;2000年03期
4 ;案例分析之四 机器人码垛单元[J];机器人技术与应用;2000年04期
5 李成桐;对中国机器人产业的思考(之二) 未来之路[J];机器人技术与应用;2000年05期
6 贾培发,王全福;团结奋斗努力实现中国机器人产业化[J];机器人技术与应用;2000年06期
7 李开生,张慧慧,费仁元,宗光华;国外服务机器人的发展动态和前景[J];制造业自动化;2000年06期
8 淑芳;机器人种菜[J];湖南农业;2000年09期
9 长路;机器人技术在发展[J];世界制造技术与装备市场;2001年01期
10 贾一;机器人外科手术的必要技术条件[J];机器人技术与应用;2002年04期
相关会议论文 前10条
1 胡春华;范勇;朱纪洪;孙增圻;;空中机器人的研究现状与发展趋势[A];2005年中国智能自动化会议论文集[C];2005年
2 陈卫东;;服务机器人的技术发展及微特电机在其中的应用[A];第十届中国小电机技术研讨会论文集[C];2005年
3 肖玉林;侍才洪;陈炜;李浩;张西正;;救援机器人的现状及发展趋势(综述)[A];天津市生物医学工程学会第三十四届学术年会论文集[C];2014年
4 郑亚青;吴建坡;;岸边集装箱宏-微起重机器人的机构、结构设计及运动仿真[A];2009海峡两岸机械科技论坛论文集[C];2009年
5 王静;边继东;张大慧;林峰华;张宏;;管道定量采样机器人系统设计[A];2009全国虚拟仪器大会论文集(二)[C];2009年
6 黄海明;杨雷;宋跃;赖思沅;;智能保安巡逻机器人[A];2009全国虚拟仪器大会论文集(二)[C];2009年
7 王明辉;马书根;李斌;;独立操作型可重构机器人群体的动态层次体系结构研究[A];第八届全国信息获取与处理学术会议论文集[C];2010年
8 谭金林;刘明英;梁建民;;机器人硬件电路设计[A];1995年中国智能自动化学术会议暨智能自动化专业委员会成立大会论文集(下册)[C];1995年
9 许家中;孔祥冰;尤波;李长峰;禹鑫q,
本文编号:2099231
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2099231.html