一类神经网络参数自适应更新与图像分类
发布时间:2021-01-12 08:55
图像分类是目前图像研究领域一个重要课题之一,找到一种能对不同种类或者发生变化的图像数据集进行分类且都具有普适性和高效性的方法将是十分必要的。常用的图像分类方法有手工提取特征的方法、基于语义的分类方法和基于神经网络的分类方法。目前比较流行的是基于神经网络的分类方法,由于该方法能通过自学习的方式学习图像并提取图像特征,识别分类图像能力较强,且计算速度快等原因,深受研究者们喜欢。但基于神经网络的分类方法也有不足之处,比如当训练样本发生变化时,已经训练好的神经网络模型不再适用于已经发生变化的训练样本。再次利用神经网络模型进行重新训练,需要大量新样本。为了避免神经网络的重新训练、分类准确度降低和大量时间的消耗等问题,本论文将提出基于神经网络自适应更新参数用以图像分类的新方法。主要创新工作如下:(1)针对不同的神经网络模型对同一种数据集进行分类时分类准确度不同的问题,提出一种网络分类模型性能评估方法。首先,建立一种评估标准以找到一个最适合某类数据集进行分类的神经网络模型;其次,利用不同的网络模型分别对相同数据集中的图像进行特征提取,然后再进行训练和分类,以便找到最适合该类待测试数据集的网络模型结构...
【文章来源】:杭州电子科技大学浙江省
【文章页数】:61 页
【学位级别】:硕士
【部分图文】:
单一神经元神经网络
杭州电子科技大学硕士学位论文7以三层网络结构为例,简单介绍下网络模型。基本的神经网络模型结构有三层,分别是输入层、隐层和输出层,结构如图2.2所示。图2.2神经网络模型示意图图2.2中,12x,x和3x代表输入,网络参数1b和2b分别是输入偏置和隐层偏置,网络参数1ijw和2ijw分别是第一层的权重和第二层的权重。其中,i表示每次输入中的第i个元素,j表示经过连接权重处理后的输出中的第j个元素。,()wbyx计算过程如下:3(1)(1)(1)(1)11112123131111()()iiiafwxwxwxbfwxb(2.2)3(1)(1)(1)(1)21212223231211()()iiiafwxwxwxbfwxb(2.3)3(1)(1)(1)(1)31312323331311()()iiiafwxwxwxbfwxb(2.4)3(2)(2)(2)(2),1112123132121()()()wbiiiyxfwawawabfwab(2.5)在上述多层网络中,用l表示层数,lijw表示第l层第i个节点到第l1层第j个节点之间的权重,lb是第l层偏置向量,lia是第l层第i个节点激活后的值。给定激活函数f、权重w和偏置b时,随意给定一个输入,就可以得到输出结果。由于激活函数不是一个固定函数,根据不同需求使用不同激活函数,一般激
杭州电子科技大学硕士学位论文8活函数都是非线性的,所以当输入过网后,得到一个非线性映射输出。输出可以有一个,也可以有多个,此时说明有多个预测结果。2.2.3卷积神经网络现今常用卷积神经网络(CNN)[38]进行图像分类,不同的网络结构分类效果不同。常见的网络结构有VGG、ResNet、LeNet和AlexNet等。卷积神经网络特性将在2.3节、2.4节和2.5节详细介绍,此处将介绍几种常见的网络模型结构。图2.3LeNet的网络结构图表2.1AlexNet网络参数配置表网络参数配置表input(227×227RGBimage)conv11-96maxpoolconv5-256maxpoolconv3-384conv3-384conv3-256maxpoolFC-4096FC-4096FC-1000图2.3是LeNet-5网络的结构图,LeNet-5是一种识别手写字符效率非常高的卷积神经网络。根据表2.3可看出,LeNet-5网络模型含有输入层、输出层、
本文编号:2972546
【文章来源】:杭州电子科技大学浙江省
【文章页数】:61 页
【学位级别】:硕士
【部分图文】:
单一神经元神经网络
杭州电子科技大学硕士学位论文7以三层网络结构为例,简单介绍下网络模型。基本的神经网络模型结构有三层,分别是输入层、隐层和输出层,结构如图2.2所示。图2.2神经网络模型示意图图2.2中,12x,x和3x代表输入,网络参数1b和2b分别是输入偏置和隐层偏置,网络参数1ijw和2ijw分别是第一层的权重和第二层的权重。其中,i表示每次输入中的第i个元素,j表示经过连接权重处理后的输出中的第j个元素。,()wbyx计算过程如下:3(1)(1)(1)(1)11112123131111()()iiiafwxwxwxbfwxb(2.2)3(1)(1)(1)(1)21212223231211()()iiiafwxwxwxbfwxb(2.3)3(1)(1)(1)(1)31312323331311()()iiiafwxwxwxbfwxb(2.4)3(2)(2)(2)(2),1112123132121()()()wbiiiyxfwawawabfwab(2.5)在上述多层网络中,用l表示层数,lijw表示第l层第i个节点到第l1层第j个节点之间的权重,lb是第l层偏置向量,lia是第l层第i个节点激活后的值。给定激活函数f、权重w和偏置b时,随意给定一个输入,就可以得到输出结果。由于激活函数不是一个固定函数,根据不同需求使用不同激活函数,一般激
杭州电子科技大学硕士学位论文8活函数都是非线性的,所以当输入过网后,得到一个非线性映射输出。输出可以有一个,也可以有多个,此时说明有多个预测结果。2.2.3卷积神经网络现今常用卷积神经网络(CNN)[38]进行图像分类,不同的网络结构分类效果不同。常见的网络结构有VGG、ResNet、LeNet和AlexNet等。卷积神经网络特性将在2.3节、2.4节和2.5节详细介绍,此处将介绍几种常见的网络模型结构。图2.3LeNet的网络结构图表2.1AlexNet网络参数配置表网络参数配置表input(227×227RGBimage)conv11-96maxpoolconv5-256maxpoolconv3-384conv3-384conv3-256maxpoolFC-4096FC-4096FC-1000图2.3是LeNet-5网络的结构图,LeNet-5是一种识别手写字符效率非常高的卷积神经网络。根据表2.3可看出,LeNet-5网络模型含有输入层、输出层、
本文编号:2972546
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2972546.html