基于深度学习的视觉重复模式分析与应用
发布时间:2022-01-11 05:31
视觉重复模式指的是在空间上或时间上重复循环出现,并且在图像内或图像序列间形成了一定的排列的模式,结构,物体。具体的例子在人类活动范围内大量存在,如建筑的窗户,货架上的商品,生产车间中的产品,视频中的人类运动等。因此,重复模式的研究与分析具有极高的学术研究价值与工业应用价值。如今,深度学习已经在许多视觉应用上得到了广泛应用,极大地推动了计算机视觉领域的发展。然而,目前基于深度学习的视觉重复模式的研究与分析仍然处于早期探索阶段。这是因为视觉重复模式的定义是一个比较高层次的语义范畴,往往依赖于大量人类先验知识。而目前的卷积神经网络算法只是简单的人为设计网络结构以拟合任务描述,其中的基于先验知识的逻辑推理过程往往被忽略,因此难以解决规则复杂的重复模式分析问题。然而,考虑到卷积神经网络本身强大的特征提取能力以及上下文信息的融合能力,基于深度学习的重复模式分析与应用应当具有极大的潜力。本文为了解决深度学习在视觉重复模式分析与应用中因为规则复杂难以被应用的困境,以如何把人类对于视觉重复模式的先验知识融入深度学习网络为着力点,研究若干个视觉重复模式相关的视觉任务,包括时间域重复模式计数,空间域的密集重...
【文章来源】:华南理工大学广东省 211工程院校 985工程院校 教育部直属院校
【文章页数】:114 页
【学位级别】:博士
【部分图文】:
一种基于传统特征的时域重复模式计数的现有方法示意图(取自文献[9])
一种基于深度学习网络的时域重复模式计数的现有方法示意图(取自文献[8])
Ren等人所提出的Faster-R-CNN网络示意图(取自文献[49])
本文编号:3582186
【文章来源】:华南理工大学广东省 211工程院校 985工程院校 教育部直属院校
【文章页数】:114 页
【学位级别】:博士
【部分图文】:
一种基于传统特征的时域重复模式计数的现有方法示意图(取自文献[9])
一种基于深度学习网络的时域重复模式计数的现有方法示意图(取自文献[8])
Ren等人所提出的Faster-R-CNN网络示意图(取自文献[49])
本文编号:3582186
本文链接:https://www.wllwen.com/shoufeilunwen/xxkjbs/3582186.html