基于卷积神经网络的图像情报目标检测和场景识别技术研究
发布时间:2022-01-03 22:34
近年来,随着战场信息化程度不断提高,各类传感器采集的图像情报数量不断增加,图像情报目标检测和场景识别已经成为军事领域的研究热点。针对海量的图像情报数据,利用计算机提取图像情报中的目标场景要素,将其转化为结构化或半结构化数据,是战场情报数据挖掘中的重要一步,对于辅助指挥员决策、掌握战场主动权具有十分重要的意义。根据上述实际需求,本文借鉴在图像识别领域广泛应用的卷积神经网络框架,针对军事图像的具体特点,研究了以卷积神经网络为基础的军事图像目标检测和场景识别方法,具体的研究内容包括以下几个方面:1.设计了基于Mask R-CNN的军事图像目标检测框架。本文通过对军事图像目标检测任务与普通自然图像目标检测任务的分析与对比,将目前目标检测领域的主流框架Mask R-CNN应用于军事图像目标检测任务中,并对Mask R-CNN框架的Anchor比例、目标区域阈值、置信度阈值几个方面做出改进。2.设计了基于层冻结迁移学习的训练方法对Mask R-CNN网络进行训练。本文根据军事图像目标检测训练数据缺乏的现状,结合迁移学习理论,设计了基于Mask R-CNN和迁移学习的军事图像目标检测框架,使用层冻结...
【文章来源】:国防科技大学湖南省 211工程院校 985工程院校
【文章页数】:82 页
【学位级别】:硕士
【部分图文】:
本文组织结构
人工神经网络(Arti?cial Neural Network,ANN)是近年来人工智能和机器视觉领域的研究热点。它根据生物神经网络的基本原理,以网络拓扑知识为基础,从信息处理的角度对生物神经网络进行抽象,通过神经元相连组成网络,形成一种数学模型。神经网络是一个由大量神经元组成的非线性复杂网络。神经网络中的每个神经元表示一种特定的输出函数,即位激活函数(Activation Function),神经元与神经元之间的连接表示连接信号的加权值,即位权重(Weight),代表相互连接的两个神经元之间相互作用的强弱。神经网络就是通过神经元的输入输出传递信号,从外部环境中获取知识,并通过内部神经元的连接强度存储获取的知识,达到模拟人脑的目的。因此,网络的结构、连接方式、权重和激活函数决定网络最终的输出。神经网络中最基本的网络结构是感知机,它只包含一个神经元,只接收一个输入,并通过感知机产生一个输出,采用阈值函数作为激励函数。在训练过程中通过不断迭代至收敛得到最终的感知机模型。感知机示意图如图2.1所示:图中感知机的输入包括四个部分:x1,x2,x3和截距项b,w0,w1,w2,w3代表权重,输入各分量分别与对应的权重相乘并求和,所得结果通过一个非线性阈值函数,得到最终输出结果h,其输出的计算公式如公式2.1所示:
其中xi表示输入向量,Wi表示对应的权重,b为截距项,表示神经元之间传递的信息。f表示激活函数,常用的激活函数有sigmoid函数和tanh函数,它们的计算公式分别如公式2.2,公式2.3所示,其函数图像如图2.2所示。近年来在图像分类与识别领域中,使用最多的函数是修正线性单元(recti?ed linear unit,ReLU)函数,其计算公式2.4所示,函数图像如图2.3所示。
本文编号:3567101
【文章来源】:国防科技大学湖南省 211工程院校 985工程院校
【文章页数】:82 页
【学位级别】:硕士
【部分图文】:
本文组织结构
人工神经网络(Arti?cial Neural Network,ANN)是近年来人工智能和机器视觉领域的研究热点。它根据生物神经网络的基本原理,以网络拓扑知识为基础,从信息处理的角度对生物神经网络进行抽象,通过神经元相连组成网络,形成一种数学模型。神经网络是一个由大量神经元组成的非线性复杂网络。神经网络中的每个神经元表示一种特定的输出函数,即位激活函数(Activation Function),神经元与神经元之间的连接表示连接信号的加权值,即位权重(Weight),代表相互连接的两个神经元之间相互作用的强弱。神经网络就是通过神经元的输入输出传递信号,从外部环境中获取知识,并通过内部神经元的连接强度存储获取的知识,达到模拟人脑的目的。因此,网络的结构、连接方式、权重和激活函数决定网络最终的输出。神经网络中最基本的网络结构是感知机,它只包含一个神经元,只接收一个输入,并通过感知机产生一个输出,采用阈值函数作为激励函数。在训练过程中通过不断迭代至收敛得到最终的感知机模型。感知机示意图如图2.1所示:图中感知机的输入包括四个部分:x1,x2,x3和截距项b,w0,w1,w2,w3代表权重,输入各分量分别与对应的权重相乘并求和,所得结果通过一个非线性阈值函数,得到最终输出结果h,其输出的计算公式如公式2.1所示:
其中xi表示输入向量,Wi表示对应的权重,b为截距项,表示神经元之间传递的信息。f表示激活函数,常用的激活函数有sigmoid函数和tanh函数,它们的计算公式分别如公式2.2,公式2.3所示,其函数图像如图2.2所示。近年来在图像分类与识别领域中,使用最多的函数是修正线性单元(recti?ed linear unit,ReLU)函数,其计算公式2.4所示,函数图像如图2.3所示。
本文编号:3567101
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3567101.html