自动驾驶场景下的多任务深度学习网络
发布时间:2021-03-17 12:31
近几年机器学习技术不断取得突破,尤其以深度学习技术常在不同领域取得超乎预计的进步。自动驾驶技术作为深度学习应用落地的重要领域而备受关注。深度学习技术在其中一般用于目标检测,语义分割,目标跟踪,深度估计等功能。而同时兼顾两个及以上功能的神经网络被称为多任务深度神经网络。而在实践中发现,车载芯片有限的计算力与深度模型庞大的计算消耗成为阻挡应用落地的最大矛盾。单一功能的深度神经网络运行在车载芯片上尚且难以实时,更遑论为了提供安全的自动驾驶需要同时运行不同功能的神经网络。所以随着自动驾驶技术研发走向深入,多任务深度学习神经网络开始成为自动驾驶技术落地的重要解决方案之一。本文通过对自动驾驶场景中目标的分析,提出一种新的多任务深度学习神经网络模型。该模型基于稠密凸目标图中实体目标底层维度边界与不同目标的分割边界近似的特点,通过将可行驶区域拆解为道路目标的方法,使用目标检测方法处理语义分割问题。新模型能够在处理目标检测和区域分割任务的同时,取消以往多任务网络中的编解码结构,减小了模型结构和运算流程,提高了多任务网络的实时性。并且通过多目标框融合方法避免了在决策关键区域可能出现的误判和干扰噪声,提高了...
【文章来源】:大连理工大学辽宁省 211工程院校 985工程院校 教育部直属院校
【文章页数】:74 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
1 绪论
1.1 研究背景与意义
1.2 国内外研究现状
1.2.1 自动驾驶视觉研究现状
1.2.2 视觉感知技术在自动驾驶领域的现状
1.3 论文研究意义
1.4 本文主要内容及章节安排
1.4.1 主要内容
1.4.2 章节安排
2 相关技术介绍
2.1 引言
2.2 传统视觉图像处理相关技术
2.3 传统辅助驾驶中的相关技术
2.3.1 前向目标检测
2.3.2 前方车距检测
2.3.3 前向碰撞预警
2.4 卷积神经网络
2.4.1 卷积神经网络特性
2.4.2 卷积神经网络在视觉感知中的相关特点
2.5 基于CNN的目标检测技术
2.5.1 模型技术特点
2.5.2 在视觉感知中的应用
2.6 基于CNN的语义分割技术
2.6.1 模型技术特点
2.6.2 在视觉感知中的应用
2.7 本章小结
3 多任务模型(Multi-task Object Model)设计
3.1 引言
3.2 问题总结及目标
3.2.1 当前通行的模型适用性分析
3.2.2 问题分析
3.2.3 任务目标分析及拆分整合
3.3 模型设计思路
3.3.1 目标检测和语义分割特征
3.3.2 评价指标评价
3.3.3 模型设计主体思路
3.3.4 分割问题处理
3.4 数据处理
3.4.1 数据收集
3.4.2 预处理
3.4.3 后处理
3.5 实验及结果分析
3.6 本章小结
4 基于外观特征的分类
4.1 引言
4.2 目标检测及识别
4.3 车型数据及分析
4.3.1 数据收集
4.3.2 数据分析
4.3.3 数据分类
4.5 结果及分析
4.6 本章小结
5 基于目标理解的距离估计
5.1 引言
5.2 目标距离估计
5.2.1 光学测距
5.2.2 基于视差的测距
5.2.3 单目测距
5.2.4 基于分割网络的像素级深度估计
5.3 基于宽度的距离估计
5.3.1 原理分析
5.3.2 误差对比
5.3.3 数据收集及处理
5.4 结果及分析
5.5 本章小结
6 模型结果及场环境构建
6.1 引言
6.2 场环境构建
6.2.1 基于遮挡的局部优化
6.2.2 侧向目标优化
6.2.3 道路适应
6.3 结果及分析
6.4 本章小结
结论
参考文献
攻读硕士学位期间发表学术论文情况
致谢
本文编号:3087144
【文章来源】:大连理工大学辽宁省 211工程院校 985工程院校 教育部直属院校
【文章页数】:74 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
1 绪论
1.1 研究背景与意义
1.2 国内外研究现状
1.2.1 自动驾驶视觉研究现状
1.2.2 视觉感知技术在自动驾驶领域的现状
1.3 论文研究意义
1.4 本文主要内容及章节安排
1.4.1 主要内容
1.4.2 章节安排
2 相关技术介绍
2.1 引言
2.2 传统视觉图像处理相关技术
2.3 传统辅助驾驶中的相关技术
2.3.1 前向目标检测
2.3.2 前方车距检测
2.3.3 前向碰撞预警
2.4 卷积神经网络
2.4.1 卷积神经网络特性
2.4.2 卷积神经网络在视觉感知中的相关特点
2.5 基于CNN的目标检测技术
2.5.1 模型技术特点
2.5.2 在视觉感知中的应用
2.6 基于CNN的语义分割技术
2.6.1 模型技术特点
2.6.2 在视觉感知中的应用
2.7 本章小结
3 多任务模型(Multi-task Object Model)设计
3.1 引言
3.2 问题总结及目标
3.2.1 当前通行的模型适用性分析
3.2.2 问题分析
3.2.3 任务目标分析及拆分整合
3.3 模型设计思路
3.3.1 目标检测和语义分割特征
3.3.2 评价指标评价
3.3.3 模型设计主体思路
3.3.4 分割问题处理
3.4 数据处理
3.4.1 数据收集
3.4.2 预处理
3.4.3 后处理
3.5 实验及结果分析
3.6 本章小结
4 基于外观特征的分类
4.1 引言
4.2 目标检测及识别
4.3 车型数据及分析
4.3.1 数据收集
4.3.2 数据分析
4.3.3 数据分类
4.5 结果及分析
4.6 本章小结
5 基于目标理解的距离估计
5.1 引言
5.2 目标距离估计
5.2.1 光学测距
5.2.2 基于视差的测距
5.2.3 单目测距
5.2.4 基于分割网络的像素级深度估计
5.3 基于宽度的距离估计
5.3.1 原理分析
5.3.2 误差对比
5.3.3 数据收集及处理
5.4 结果及分析
5.5 本章小结
6 模型结果及场环境构建
6.1 引言
6.2 场环境构建
6.2.1 基于遮挡的局部优化
6.2.2 侧向目标优化
6.2.3 道路适应
6.3 结果及分析
6.4 本章小结
结论
参考文献
攻读硕士学位期间发表学术论文情况
致谢
本文编号:3087144
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3087144.html