当前位置:主页 > 科技论文 > 自动化论文 >

基于改进卷积神经网络的光流预测算法研究

发布时间:2022-10-30 11:29
  光流是目前运动图像分析的重要方法和工具,现已发展成为计算机视觉领域的一个重要分支。光流所表示的是空间运动物体,在观察参考平面上像素的运动状态。光流预测算法是利用图像序列中相邻两帧之间的相关性和对应关系,来找到对应像素在时间和空间上的变化,以此计算相邻两帧间目标对象运动状态的方法。光流表达了图像像素的变化,由于它包含了目标运动的信息,因此可被观察者用来确定目标的运动情况。研究光流场的目的就是为了从图像序列中近似得到不能直接得到的运动场。因此对光流信息的研究在图像处理领域有着重要的理论价值。基于变分能量模型的预测方法和基于块匹配的启发式方法是光流预测中最主流的传统预测方法,而这些方法对图像的适应性有限,缺乏泛化性,效率低且操作和计算上较为复杂,不利于复杂图像数据光流的提取。而使用卷积神经网络(Convolutional Neural Network,CNN)可以避免人工构造特征所导致计算繁琐且适应性差的问题,通过海量数据自适应学习所需特征,能够更好得提取数据深层信息,且对不同类型图像数据有着较强的适应性。但由于图像光流预测中存在许多复杂问题,例如遮挡、大位移导致目标搜索丢失以及图像细节特征... 

【文章页数】:57 页

【学位级别】:硕士

【文章目录】:
摘要
abstract
1 绪论
    1.1 课题研究背景和意义
        1.1.1 研究背景
        1.1.2 选题意义
    1.2 光流预测算法的研究现状
        1.2.1 传统方法研究现状
        1.2.2 深度学习方法研究现状
    1.3 本文算法拟解决问题
    1.4 本文主要研究内容及章节安排
    1.5 本章小结
2 光流预测基本知识介绍
    2.1 图像光流的基本概念
    2.2 光流预测的基本原理
        2.2.1 传统变分方法的原理介绍
        2.2.2 深度学习方法的原理介绍
    2.3 基于卷积神经网络的光流预测模型优化思路
    2.4 本章小结
3 基于卷积神经网络的光流预测模型
    3.1 引言
    3.2 总体网络架构概述
    3.3 可形变卷积特征提取
        3.3.1 可形变卷积捕获细节和大位移特征
        3.3.2 可形变池化
    3.4 基于注意力机制的帧间特征关联层
        3.4.1 注意力机制的原理
        3.4.2 Encoder-Decoder框架解释
        3.4.3 基于通道注意力的特征关联层
    3.5 光流预测与网络级联光流优化
        3.5.1 Warp损失量
        3.5.2 级联网络搭建
    3.6 网络训练细节
    3.7 本章小结
4 实验结果与分析
    4.1 引言
    4.2 数据集介绍
        4.2.1 Flying Chairs数据集
        4.2.2 Mpi Sintel数据集
    4.3 基于Flying Chairs数据集的算法测试和其他方法的精度比较
        4.3.1 对比方法简介
        4.3.2 数据分析对比
    4.4 基于Mpi Sintel数据集的算法测试和其他文献的精度比较
        4.4.1 对比方法简介
        4.4.2 精度分析对比
    4.5 光流预测在遮挡、大位移、细节呈现三个方面的鲁棒性分析
        4.5.1 遮挡问题的鲁棒性分析
        4.5.2 大位移问题的鲁棒性分析
        4.5.3 细节图像的光流预测鲁棒性分析
    4.6 本章小结
总结与展望
    总结
    展望
参考文献
致谢
攻读学位期间发表的学术论文目录


【参考文献】:
期刊论文
[1]基于双向注意力机制图像描述方法研究[J]. 陶云松,张丽红.  测试技术学报. 2019(04)
[2]相互结构引导滤波TV-L1变分光流估计[J]. 葛利跃,张聪炫,陈震,黎明,陈昊.  电子学报. 2019(03)
[3]视觉注意力检测技术研究综述[J]. 罗元,陈雪峰,毛雪峰,张毅.  半导体光电. 2019(01)
[4]I-vector聚类字典及注意力机制框架的说话人自适应[J]. 黄俊,蒋兵,李先刚,郭武生,戴礼荣.  小型微型计算机系统. 2019(02)
[5]视觉注意力检测综述[J]. 王文冠,沈建冰,贾云得.  软件学报. 2019(02)
[6]卷积神经网络综述[J]. 刘健,袁谦,吴广,喻晓.  计算机时代. 2018(11)
[7]基于分层置信度传播的光流估计方法[J]. 张子星,文颖.  计算机系统应用. 2018(09)
[8]基于注意力机制的句子排序方法[J]. 栾克鑫,杜新凯,孙承杰,刘秉权,王晓龙.  中文信息学报. 2018(01)
[9]图像理解中的卷积神经网络[J]. 常亮,邓小明,周明全,武仲科,袁野,杨硕,王宏安.  自动化学报. 2016(09)

硕士论文
[1]基于非刚性稠密匹配的变分光流计算技术研究[D]. 熊帆.南昌航空大学 2018



本文编号:3698806

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3698806.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户a3160***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com