当前位置:主页 > 科技论文 > 自动化论文 >

用于视觉假体图像分类的BCNN设计

发布时间:2020-12-15 01:09
  视觉假体是一种通过控制电极来构造图像的嵌入式系统,它通过人体内植入的电极构造点阵形成图像,并将构成的图像送往盲人视觉系统使其恢复部分视力。由于植入人体的电极数量有限,通常电极构成的图像辨识度很低,导致视觉假体的使用效果并不理想,依然存在很多困难。因此本文提出使用分类神经网络来辅助视觉假体工作,从而降低视觉假体的使用难度。为了降低分类神经网络在视觉假体嵌入式系统中的移植难度,本文的主要工作是对二值化神经网络算法进行改进和参数压缩。本文针对二值化算法BinaryNet的缺点提出了AlexNet-Binarized,InceptionNet-Binarized,IBNet三种改进算法,其中IBNet使用双重恒等映射方法来提高网络的准确度并使用两个超参数来控制恒等映射的程度,三种算法在基准测试集CIFAR-10上分别进行了性能测试,测试结果显示IBNet的综合性能最佳。最后本文在自制的室内环境数据集上对IBNet和BinaryNet算法进行了性能对比,对权值参数量进行了压缩,并测试了BinaryNet和IBNet处理32×32图像的速度。本文提出的AlexNet-Binarized在CIFAR... 

【文章来源】:西安理工大学陕西省

【文章页数】:52 页

【学位级别】:硕士

【部分图文】:

用于视觉假体图像分类的BCNN设计


最大池化层:用于选择特征

网络模型


2 深度学习的原理及结构2.3 深度学习的模型结构及原理2.3.1 AlexNet 的结构及原理AlexNet 模型是一种深度学习神经网络,模型中主要结构都是由卷积层和池化层组成,其中卷积层的输出是使用卷积核对前一层特征层卷积后的结果。这种网络通常会把标量偏差添加到卷积后的结果中共同输出,并且在将神经元的输出传递到下一层之前会使用非线性激活函数作用于输出结果。线性滤波器和偏置被称为权重,初始时使用随机产生的方法初始化权值,之后权值是通过从训练数据中不断学习而修改,从而得到最后网络的参数。CNN 在几个方面不同于普通的神经网络:首先,CNN 中的神经元在形状上被组织成一个反映输入数据中维度的空间结构,因此,对于图像来说神经元分布在空间网格上。其次,CNN 中的神经元使用了卷积核,这些卷积核有着卷积范围的限制,并且以神经元的中心位置作为输出,这符合输入维度的依赖性是距离的递减函数的要求,自然图像中的像素往往是这种情况。特别是,人们期望通过检查图像的小局部邻域可以找到输入图像中有关于对象身份的有用线索。

数据分布,数据分布,归一化,神经网络


导致神经网络的性能很差,而 BN 算法能处就是可以通过每一次对数据的归一化加快网据都不一致,所以神经网络每次都需要去适应分布不同的问题。速二值化网络的原理如图 3-4 所示,没有归一所示那样,神经网络在初始化网络参数 W,b 的附近,而 W,b 构成的空间曲面也会在中心位置照学习率的大小来一步一步逼近数据,最后进行,均值为 0,方差为 1,各个维度数据去相关,,如图 3-4 中间的数据点,这时候任意初始化过数据了,因此训练调整权值时进程会加快,且后依然保证了数据的结构不改变,从而保证了数处理然后再重构后,一些特别小的数据得到了 BN 层还能改善了梯度弥散问题。


本文编号:2917355

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2917355.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户daec5***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com