面向户外增强现实的地理实体目标识别与检测
本文选题:户外增强现实 切入点:深度学习 出处:《武汉大学》2017年硕士论文 论文类型:学位论文
【摘要】:随着移动互联网的快速发展,户外增强现实系统有越来越多的使用场景,如社交、购物、娱乐等。增强现实系统的核心在于跟踪注册算法的设计,主流算法为混合跟踪注册思想,在混合注册算法中基于视觉识别的跟踪注册最为关键,传统算法以提取特征点为核心,但由于计算量大且精度不高等问题影响着跟踪注册的效率。随着在计算机视觉领域中的深度学习思想的快速发展,以卷积神经网络为核心的图像识别模型也得到普遍应用,并且实验证明该算法比传统算法大大提高了图像识别精度和效率。本文研究了多种用于图像分类和目标检测的卷积神经网络模型,分析了各个模型的优缺点,并结合实际的应用在优秀的卷积神经网络SSD(单次检测模型)模型的基础上,更换了三层前置网络结构,较少了网络的深度,设计了不同长宽比的默认框,从而简化了模型用于识别户外的地理目标。参考ImageNet和PASCAL VOC 2007的训练集,采集数据并设计了训练和预测的数据集,在深度学习平台MXNET上训练简化的SSD模型,最终得到SSD模型的网络结构和权重值,该模型的mAP达到58.2%,PC端处理一张图像的时间为0.03s。本文将深度学习思想用于解决移动增强现实系统中的跟踪注册问题,采用基于传感器的非视觉感知和基于深度学习的视觉识别混合跟踪注册方式开发了移动户外增强现实原型系统,该系统是采用本地客户端的模式,利用安卓手机的传感器系统来获取手机姿态和当前位置信息,将训练好的简化SSD模型作为图像识别的引擎,使用GPU来完成计算过程,另外,针对地理目标设计了本地的二维和三维增强信息,提供了简单的交互模式,最终在实际测试中的处理图像的速度为1.5s,目标识别的置信度在90%左右。
[Abstract]:With the rapid development of mobile Internet, outdoor augmented reality systems have more and more use scenarios, such as social, shopping, entertainment, etc. The core of augmented reality system is to track the design of registration algorithm. The mainstream algorithm is hybrid tracking registration. In the hybrid registration algorithm, visual recognition based tracking registration is the key. The traditional algorithm takes extracting feature points as the core. However, the efficiency of tracking registration is affected by many problems, such as large computation and low precision. With the rapid development of depth learning in the field of computer vision, the image recognition model with convolution neural network as the core is also widely used. Experiments show that the algorithm improves the accuracy and efficiency of image recognition greatly. In this paper, several convolution neural network models for image classification and target detection are studied, and the advantages and disadvantages of each model are analyzed. Combined with practical application, based on the excellent model of convolution neural network (SSD), the three-layer network structure is replaced, the depth of the network is reduced, and the default frame with different aspect ratio is designed. Therefore, the model is used to identify outdoor geographical targets. Referring to the training set of ImageNet and PASCAL VOC 2007, the training and prediction data sets are collected, and the simplified SSD model is trained on the MXNET platform. Finally, the network structure and weight of SSD model are obtained. The mAP of the model reaches 58.2 and the time of processing an image is 0.03s. In this paper, the idea of depth learning is used to solve the problem of tracking registration in mobile augmented reality system. A mobile outdoor augmented reality prototype system is developed by using non-visual perception based on sensor and visual recognition and registration based on deep learning. The system adopts the mode of local client. Using the sensor system of Android phone to obtain the mobile phone attitude and current position information, using the trained simplified SSD model as the image recognition engine, using GPU to complete the calculation process, in addition, The local 2D and 3D enhancement information is designed for geographical targets, and a simple interactive mode is provided. Finally, the speed of image processing in the actual test is 1.5 seconds, and the confidence of target recognition is about 90%.
【学位授予单位】:武汉大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP183;TP391.41
【相似文献】
相关期刊论文 前10条
1 林P;杨珂;王涌天;刘越;;移动增强现实系统的关键技术研究[J];中国图象图形学报;2009年03期
2 徐超;;增强现实,3G的潜在“杀手”应用?[J];通信世界;2010年10期
3 ;苹果两项新专利解读:增强现实与半透明屏幕[J];硅谷;2011年15期
4 蔡苏;宋倩;唐瑶;;增强现实学习环境的架构与实践[J];中国电化教育;2011年08期
5 ;移动增强现实国家重大专项正式启动[J];信息技术与标准化;2012年03期
6 赵越;;基于移动增强现实的学习形式研究[J];科技资讯;2013年06期
7 张健;蔡新元;;“增强现实”在传统出版领域中的应用探索[J];科技与出版;2013年10期
8 裴燕;;“增强现实”的革命[J];IT经理世界;2013年24期
9 陈靖,王涌天,闫达远;增强现实系统及其应用[J];计算机工程与应用;2001年15期
10 徐伟平,朱仲涛,丁晓玲,赵强;增强现实硬件平台的实现与应用[J];实验技术与管理;2003年01期
相关会议论文 前10条
1 刘越;王涌天;闫达远;;增强现实系统显示技术研究[A];第三届全国数字成像技术及相关材料发展与应用学术研讨会论文摘要集[C];2004年
2 张旭光;阎镇;;面向遥科学实验的增强现实应用研究[A];第二十三届全国空间探测学术交流会论文摘要集[C];2010年
3 王倩;高长城;徐大卫;;基于虚实像结合的增强现实研究[A];图像图形技术研究与应用2009——第四届图像图形技术与应用学术会议论文集[C];2009年
4 李丹;黄有群;;增强现实交互技术的研究[A];2007北京地区高校研究生学术交流会通信与信息技术会议论文集(上册)[C];2008年
5 葛莹;;基于视频影像的地理数据增强现实可视化研究[A];中国地理学会百年庆典学术论文摘要集[C];2009年
6 葛学东;;增强现实一致光照技术研究[A];第十三届全国图象图形学学术会议论文集[C];2006年
7 周志颖;郑思远;昌明;;增强现实内容管理云平台在数字科技馆中的应用[A];第十六届中国科协年会——分16以科学发展的新视野,努力创新科技教育内容论坛论文集[C];2014年
8 王坚;;虚拟现实和增强现实的人机交互技术[A];计算机技术在工程建设中的应用——第十二届全国工程建设计算机应用学术会议演讲辑录[C];2004年
9 王红;周雅;高宇;闫达远;;光学透视式增强现实系统虚实亮度匹配研究[A];中国光学学会2006年学术大会论文摘要集[C];2006年
10 赵小军;游旭群;石常秀;甘硕秋;;基于增强现实技术的催眠治疗:心理压力和焦虑[A];心理学与创新能力提升——第十六届全国心理学学术会议论文集[C];2013年
相关重要报纸文章 前10条
1 本报记者 逄丹;“增强现实”用虚拟美化现实[N];通信产业报;2010年
2 中国移动研究院业务研究所 陈志刚;“增强现实”适宜后向收费[N];通信产业报;2010年
3 本报记者 邹大斌;增强现实:互联网应用的新热点[N];计算机世界;2011年
4 ;移动增强现实:是炒作还是下一件大事?[N];网络世界;2010年
5 ;AR:更深刻的现实[N];中国高新技术产业导报;2002年
6 本报记者 刘霞;2020年的可能和不可能[N];科技日报;2011年
7 特约作者 苏驰;真亦假时假亦真[N];电脑报;2010年
8 华凌;NASA为商业飞行员开发增强现实设备[N];科技日报;2012年
9 荆晶;手机带你穿越时空,如梦如幻回到从前[N];新华每日电讯;2009年
10 陈志鸿;荷兰邮票使用“增强现实”技术展现“托塔”情景[N];中国集邮报;2011年
相关博士学位论文 前10条
1 林一;基于上下文感知的移动增强现实浏览器构建及优化方法研究[D];北京理工大学;2015年
2 赵越;实时增强现实中运动目标及场景的跟踪注册关键问题研究[D];东北大学;2015年
3 陆平;移动增强现实中的图像处理关键技术研究及应用[D];东南大学;2015年
4 魏小东;面向教育应用的增强现实系统关键问题研究[D];北京理工大学;2015年
5 赵新灿;增强现实维修诱导系统关键技术研究[D];南京航空航天大学;2007年
6 姚远;增强现实应用技术研究[D];浙江大学;2006年
7 董子龙;面向增强现实的实时三维跟踪[D];浙江大学;2010年
8 冯晓伟;增强现实工业培训系统研究[D];华东师范大学;2012年
9 桂振文;面向移动增强现实的场景识别与跟踪注册技术研究[D];北京理工大学;2014年
10 丰艳;增强现实系统虚实无缝融合相关问题研究[D];上海大学;2007年
相关硕士学位论文 前10条
1 徐灵;增强现实广告技术的创新扩散研究[D];湖南大学;2012年
2 Pp冬慧;基于增强现实的手部康复训练系统的研究[D];南京信息工程大学;2015年
3 夏德芳;移动增强现实中位姿计算与静态手势识别交互研究[D];南京理工大学;2015年
4 李洁;基于Android平台的增强现实系统研究与应用[D];河北农业大学;2015年
5 张恺夫;基于增强现实的交通安全公益广告设计及其效果研究[D];哈尔滨工业大学;2015年
6 康磊;地标性建筑的增强现实系统设计研究[D];哈尔滨工业大学;2015年
7 赵王军;面向信息物理Web的增强现实浏览器设计与实现[D];浙江大学;2015年
8 彭雪;基于传感器的增强现实关键技术研究[D];上海大学;2015年
9 田远霞;增强现实下多通道交互模型研究与实现[D];浙江大学;2015年
10 严玉若;增强现实中视觉反馈关键技术研究[D];上海大学;2015年
,本文编号:1603663
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1603663.html