基于R-FCN算法的糖尿病眼底病变自动诊断
发布时间:2021-04-08 21:16
糖尿病眼底病变(Diabetic Retinopathy,DR)是糖尿病患者常见的致盲疾病,可使用深度学习算法对患者的糖尿病眼底图片进行图像识别,实现对糖尿病眼底病变的辅助诊断。针对以往普通卷积神经网络只能进行分类和输入尺寸固定的问题,提出了基于目标检测的区域全卷积网络(Region-based Fully Convolutional Networks,R-FCN)算法,实现同时对任意尺寸输入的糖尿病眼底图片的分类和病变区域检测。针对原始R-FCN算法对小目标(极小的出血点和血管瘤)检测困难的问题,对R-FCN算法做了一定的改进,加入特征金字塔网络(Feature Pyramid Networks,FPN)结构,升级主干网络,修改区域建议网络(Region Proposal Network,RPN)。实现结果表明,改进后的RFCN算法能以很高的正确率实现对糖尿病眼底图片的五级分类(健康、轻度、中度、重度、增殖)和病变区域检测(血管瘤、眼底出血、玻璃体出血)。
【文章来源】:计算机工程与应用. 2020,56(04)北大核心CSCD
【文章页数】:6 页
【部分图文】:
轻度眼底图片预测结果
1 增殖眼底图片预测结果
如图1所示,R-FCN原型主要由以下几部分组成:(1)输入;(2)提取特征的主干网络ResNet[16](Residual Networks);(3)RPN网络;(4)RoI池化层;(5)非极大值抑制[17](Non Maximum Suppression,NMS)。原型R-FCN算法默认使用ResNet-101的全卷积神经网络[18]进行提取特征,去除ResNet-101原本的全连接层,保留100层卷积进行下采样,最后输出的卷积特征图分别送入RPN网络和RoI池化层。RPN网络,即区域建议网络,其功能是区分前景和背景,寻找目标的大概位置,输出目标候选框。然后,RPN输出的目标候选框和主干网络的卷积特征图同时作为RoI池化层的输入,生成位置敏感分数图(Position Sensitive Score Maps)以及位置敏感分数图上的RoI区域,池化后连接一个softmax分类层和边框回归层,对目标进行精确分类和边框回归。最后,使用NMS去除重叠度IoU较大的目标框,输出最终结果。
本文编号:3126290
【文章来源】:计算机工程与应用. 2020,56(04)北大核心CSCD
【文章页数】:6 页
【部分图文】:
轻度眼底图片预测结果
1 增殖眼底图片预测结果
如图1所示,R-FCN原型主要由以下几部分组成:(1)输入;(2)提取特征的主干网络ResNet[16](Residual Networks);(3)RPN网络;(4)RoI池化层;(5)非极大值抑制[17](Non Maximum Suppression,NMS)。原型R-FCN算法默认使用ResNet-101的全卷积神经网络[18]进行提取特征,去除ResNet-101原本的全连接层,保留100层卷积进行下采样,最后输出的卷积特征图分别送入RPN网络和RoI池化层。RPN网络,即区域建议网络,其功能是区分前景和背景,寻找目标的大概位置,输出目标候选框。然后,RPN输出的目标候选框和主干网络的卷积特征图同时作为RoI池化层的输入,生成位置敏感分数图(Position Sensitive Score Maps)以及位置敏感分数图上的RoI区域,池化后连接一个softmax分类层和边框回归层,对目标进行精确分类和边框回归。最后,使用NMS去除重叠度IoU较大的目标框,输出最终结果。
本文编号:3126290
本文链接:https://www.wllwen.com/yixuelunwen/wuguanyixuelunwen/3126290.html
最近更新
教材专著