基于结构化深度学习的单目图像深度估计
本文选题:深度估计 + 卷积神经网络 ; 参考:《机器人》2017年06期
【摘要】:为从单目图像中提取到丰富的3D结构特征,并用以推测场景的深度信息,针对单目图像深度估计任务提出了一种结构化深度学习模型,该模型将一种新的多尺度卷积神经网络与连续条件随机场统一于一个深度学习框架中.卷积神经网络可以从图像中学习到相关特征表达,而连续条件随机场可以根据图像像素的位置、颜色信息对卷积神经网络输出进行优化,将二者参数以联合优化的方式进行学习可以提升模型的泛化性能.通过在NYU Depth数据集上的实验验证了模型的有效性与优越性,该模型预测结果的平均相对误差为0.187,均方根误差为0.074,对数空间平均误差为0.671.
[Abstract]:In order to extract rich 3D structure features from monocular images and to speculate the depth information of the scene, a structured depth learning model is proposed for the monocular image depth estimation task. The model unifies a new multi-scale convolution neural network and a continuous conditional random field into a deep learning framework. The convolution neural network can learn the expression of related features from the image, while the continuous conditional random field can optimize the output of the convolutional neural network according to the pixel location and color information of the image. The generalization performance of the model can be improved by learning the two parameters in a joint optimization way. The validity and superiority of the model are verified by experiments on NYU depth dataset. The average relative error, root mean square error and logarithmic space average error of the model are 0.187, 0.074 and 0.671 respectively.
【作者单位】: 哈尔滨理工大学自动化学院;中国科学院自动化研究所;
【基金】:国家自然科学基金(61572500)
【分类号】:TP18;TP391.41
【相似文献】
相关期刊论文 前10条
1 赵信宇;朱晓蕊;余锦全;;单幅图像深度信息的提取[J];制造业自动化;2010年03期
2 李乐;张茂军;熊志辉;徐玮;;基于内容理解的单幅静态街景图像深度估计[J];机器人;2011年02期
3 廖均梅;龙建忠;张小琴;;基于频域特征的图像深度信息提取方法[J];自动化与仪器仪表;2012年06期
4 张蓓蕾;刘洪玮;;基于马尔可夫随机场的单目图像深度估计[J];微型电脑应用;2010年11期
5 牛连丁;赵志杰;金雪松;孙华东;王海涛;;基于支持向量机的图像深度提取方法[J];哈尔滨商业大学学报(自然科学版);2012年05期
6 王平;安平;王奎;张兆杨;;基于区域融合的单视点图像深度信息提取[J];电视技术;2011年19期
7 袁红星;吴少群;朱仁祥;胡劲松;安鹏;;利用深度传感器大数据的单目图像深度估计[J];计算机辅助设计与图形学学报;2013年12期
8 张蓓蕾;孙韶媛;武江伟;谷小婧;;基于DRF-MAP模型的单目图像深度估计的改进算法[J];红外技术;2009年12期
9 邓小玲;倪江群;代芬;李震;;基于LLOM的单目图像深度图估计算法[J];计算机应用研究;2012年11期
10 李国平;刘华冠;李长春;张天厚;;基于机器视觉的物料袋图像深度信息的提取[J];济南大学学报(自然科学版);2010年02期
相关会议论文 前2条
1 王东波;陈小荷;年洪东;;基于条件随机场的有标记联合结构自动识别[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
2 张奇;翁富良;黄萱菁;吴立德;;英文口语中非流利区域的检测[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
相关硕士学位论文 前10条
1 Grigorev Aleksei;基于深度学习的单目图像深度估计[D];哈尔滨工业大学;2016年
2 张蓓蕾;基于马尔可夫场理论的单目图像深度估计研究[D];东华大学;2010年
3 陈婷婷;基于纹理特征概率模型的图像深度信息提取方法[D];哈尔滨商业大学;2015年
4 赵九洋;图像中行人检测关键技术研究[D];南京大学;2015年
5 宁振;基于层叠条件随机场的情感分析[D];南昌大学;2015年
6 杨献祥;面向中文微博的产品名实体识别与规范化算法设计与实现[D];北京理工大学;2015年
7 肖s,
本文编号:2110737
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2110737.html