神经网络算法在物体姿态估计与图像阈值分割中的应用研究
发布时间:2021-08-27 18:16
随着计算机科学的不断进步,神经网络算法已经被应用于社会发展的各个领域中。物体姿态估计和图像阈值分割问题一直是人工智能领域的基本问题,使用神经网络算法对它们进行研究是一个非常活跃的研究领域。在物体姿态估计问题中,获取物体的类别和准确的姿态信息是机器人完成与环境交互的重要前提;在图像阈值分割问题中,精确的选取图像分割的阈值,可以更好的把图像的前景与背景分离,以便于对图像进行下一步操作。本文的研究内容主要包括:1、物体姿态估计在近十年取得了令人瞩目的进展。但是,对于复杂场景下物体的姿态识别问题仍具有挑战性。本文在VGG网络的基础上,提出一种改进的卷积神经网络模型,采用多阶段的方式对数据进行特征提取。对于基于学习的方法而言,大量的数据是必要的,本文采用一种快速合成图像数据的方法,可以在短时间内生成大量合格的训练数据。实验结果表明,改进的网络模型可以更好的提取数据特征,获得更加准确的物体姿态估计结果。2、针对图像阈值分割问题,提出了一种协作神经动力学优化算法,实现了二值优化在图像分割中的应用。首先将基于阈值的图像分割问题转化为带约束的二值优化问题。在此基础上,提出了一种结合反馈神经网络和粒子群算...
【文章来源】:西南大学重庆市 211工程院校 教育部直属院校
【文章页数】:65 页
【学位级别】:硕士
【部分图文】:
卷积神经网络模型结构图
西南大学硕士学位论文图2.5卷积神经网络模型结构图该算法包括七层的网络架构,包含输入、两层卷积、两层池化、一个全连接层和一个输出层,其中的卷积层是最核心的部分用于提取数据特征,池化层可以降低数据维度及减少训练过程中的参数,全连接层作为分类使用一般放在网络的尾部。在该网络中,输入数据是一个32×32大小的数据,利用6个5×5的卷积核获得6图2.6LeNet-5架构图.个规模是28×28的特征图,即C1层;接下来利用池化进行下采样,采样核的尺寸大小为2×2,从而得到S2,大小为14×14的特征图;C3层利用为16个5×5的卷积核,获得16个特征图规模为10×10;接着仍然使用2×2大小的池化核来下采样,运算结果是16个5×5的特征图,即S4层;C5层再次使用5×5的卷积,得到的特征图尺寸为1×1,这样采用120个卷积核,得到120×1的一维向量,再通过全连接层F6,可得到输出层的10个分类单元。根据这个十个节点数值响应大小,可以判断输入数据对应是哪个数字。2.1.4池化层池化是卷积神经网络中一个重要操作,也可以称之为下采样。在卷积进行特征提取得到的特征图中,目标任务的特征是有限的,而大多数是一些冗余的信息,14
西南大学硕士学位论文YCB[93]数据集是一个包含21个物体模型信息的位姿数据集,我们制作的数据集从YCB子集中选取八个物体进行数据合成,挑选的物体如下图3.2所示。为图3.2数据合成选择的YCB对象了避免人工的方式手动采集数据,这里使用Blender工具进行数据合成的操作。Blender是一个功能强大的三维建模软件,可以很轻松的对物体的三维模型进行渲染,从而可以实现模拟摄像机各个视角的功能,满足实验数据的要求。合成结果如下图3.3a所示。在实验阶段,我们应用了一个更简单的策略,以HDR格式的图片作为背景图像,然后将物体对象的三维模型连同HDR图像一起导入Blender,合成物体在复杂背景下的数据,如下图3.3b。(a)椅子和物体合成的示意图(b)复杂背景下数据合成示意图图3.3Blender数据合成示意图26
【参考文献】:
期刊论文
[1]人工智能的学科定位与发展战略[J]. 陈·巴特尔,苏明. 国家教育行政学院学报. 2019(08)
[2]关于图像分割算法的研究[J]. 齐千慧,田益民,韩利利,张天颖. 北京印刷学院学报. 2019(07)
[3]图像区域分割算法综述及比较[J]. 王媛媛. 产业与科技论坛. 2019(13)
[4]深度学习方法研究综述[J]. 高明旭,李靖,朱绪平,常延辉. 中国科技信息. 2019(10)
[5]人工智能艺术刍议[J]. 苏露露,苏峰. 大众文艺. 2018(05)
[6]神经网络七十年:回顾与展望[J]. 焦李成,杨淑媛,刘芳,王士刚,冯志玺. 计算机学报. 2016(08)
[7]深度学习研究综述[J]. 孙志军,薛磊,许阳明,王正. 计算机应用研究. 2012(08)
[8]基于0-1规划的快速图像阈值分割算法[J]. 陈露晨. 计算机工程与应用. 2012(10)
[9]人工神经网络研究与发展综述[J]. 王辉. 电脑知识与技术. 2008(30)
[10]通用并行神经网络模拟系统GP2N2S2[J]. 陈国良,熊焰,方祥. 小型微型计算机系统. 1992(12)
博士论文
[1]深度卷积神经网络中反馈机制的计算建模及应用研究[D]. 曹春水.中国科学技术大学 2018
本文编号:3366851
【文章来源】:西南大学重庆市 211工程院校 教育部直属院校
【文章页数】:65 页
【学位级别】:硕士
【部分图文】:
卷积神经网络模型结构图
西南大学硕士学位论文图2.5卷积神经网络模型结构图该算法包括七层的网络架构,包含输入、两层卷积、两层池化、一个全连接层和一个输出层,其中的卷积层是最核心的部分用于提取数据特征,池化层可以降低数据维度及减少训练过程中的参数,全连接层作为分类使用一般放在网络的尾部。在该网络中,输入数据是一个32×32大小的数据,利用6个5×5的卷积核获得6图2.6LeNet-5架构图.个规模是28×28的特征图,即C1层;接下来利用池化进行下采样,采样核的尺寸大小为2×2,从而得到S2,大小为14×14的特征图;C3层利用为16个5×5的卷积核,获得16个特征图规模为10×10;接着仍然使用2×2大小的池化核来下采样,运算结果是16个5×5的特征图,即S4层;C5层再次使用5×5的卷积,得到的特征图尺寸为1×1,这样采用120个卷积核,得到120×1的一维向量,再通过全连接层F6,可得到输出层的10个分类单元。根据这个十个节点数值响应大小,可以判断输入数据对应是哪个数字。2.1.4池化层池化是卷积神经网络中一个重要操作,也可以称之为下采样。在卷积进行特征提取得到的特征图中,目标任务的特征是有限的,而大多数是一些冗余的信息,14
西南大学硕士学位论文YCB[93]数据集是一个包含21个物体模型信息的位姿数据集,我们制作的数据集从YCB子集中选取八个物体进行数据合成,挑选的物体如下图3.2所示。为图3.2数据合成选择的YCB对象了避免人工的方式手动采集数据,这里使用Blender工具进行数据合成的操作。Blender是一个功能强大的三维建模软件,可以很轻松的对物体的三维模型进行渲染,从而可以实现模拟摄像机各个视角的功能,满足实验数据的要求。合成结果如下图3.3a所示。在实验阶段,我们应用了一个更简单的策略,以HDR格式的图片作为背景图像,然后将物体对象的三维模型连同HDR图像一起导入Blender,合成物体在复杂背景下的数据,如下图3.3b。(a)椅子和物体合成的示意图(b)复杂背景下数据合成示意图图3.3Blender数据合成示意图26
【参考文献】:
期刊论文
[1]人工智能的学科定位与发展战略[J]. 陈·巴特尔,苏明. 国家教育行政学院学报. 2019(08)
[2]关于图像分割算法的研究[J]. 齐千慧,田益民,韩利利,张天颖. 北京印刷学院学报. 2019(07)
[3]图像区域分割算法综述及比较[J]. 王媛媛. 产业与科技论坛. 2019(13)
[4]深度学习方法研究综述[J]. 高明旭,李靖,朱绪平,常延辉. 中国科技信息. 2019(10)
[5]人工智能艺术刍议[J]. 苏露露,苏峰. 大众文艺. 2018(05)
[6]神经网络七十年:回顾与展望[J]. 焦李成,杨淑媛,刘芳,王士刚,冯志玺. 计算机学报. 2016(08)
[7]深度学习研究综述[J]. 孙志军,薛磊,许阳明,王正. 计算机应用研究. 2012(08)
[8]基于0-1规划的快速图像阈值分割算法[J]. 陈露晨. 计算机工程与应用. 2012(10)
[9]人工神经网络研究与发展综述[J]. 王辉. 电脑知识与技术. 2008(30)
[10]通用并行神经网络模拟系统GP2N2S2[J]. 陈国良,熊焰,方祥. 小型微型计算机系统. 1992(12)
博士论文
[1]深度卷积神经网络中反馈机制的计算建模及应用研究[D]. 曹春水.中国科学技术大学 2018
本文编号:3366851
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3366851.html