基于深度学习的面部跟踪与表情识别
发布时间:2021-02-21 10:38
面部表情是人体语言的重要组成部分,是人类生理和心理活动的窗口,可以传递人类的内心情感状态。当前,面部表情分析已经成为了计算机视觉、模式识别、人工智能等领域的一个热点研究课题。另一方面,近年来深度学习技术发展迅猛,已经广泛地应用于计算机视觉的研究中,取得了非常好的效果。本文旨在利用深度学习的技术,研究面部表情分析所涉及的两项关键技术:人脸面部跟踪和人脸表情识别。人脸面部跟踪作为面部表情分析研究中一项非常重要的前端技术,是开发真正实用的实时面部表情分析系统的先决条件。而人脸表情识别又是面部表情分析中的一个重要目标,成熟的人脸表情识别技术具有非常大的应用价值。本文的贡献总结如下:(1)深入研究了真实场景下的人脸面部跟踪问题。为了提高面部跟踪的准确性,本文利用图的旋转不变性和平移不变性性质,提出了一种基于谱滤波的面部跟踪算法。该算法简单有效,易于实现,能够很好地解决面部跟踪过程中目标经常发生的形变和旋转问题。本文的算法在自建的儿童面部跟踪数据库和标准目标跟踪数据集上进行了评测,取得了非常好的结果。(2)研究了基于视频的真实场景下的动态表情识别。本文提出了一种基于卷积神经网络与循环神经网络相融合...
【文章来源】:东南大学江苏省 211工程院校 985工程院校 教育部直属院校
【文章页数】:67 页
【学位级别】:硕士
【部分图文】:
谱滤波SFT跟踪算法流程图
由一组顶点 ( )和一组边 构成,邻接矩阵 表示连接的边上的正值权重。每个顶点与一个信号相关联,即多通道特征向量是从其对应的坐标位置上提取的,特征提取函数 定义了顶点的信号,其中 是信号的维度。在谱图理论中,最为关键的一个算子就是图的拉普拉斯算子 ,算子定义为 D ,其中D × 是对角度矩阵,即 。一个常用的算子是归一化后的图的拉普拉斯算子,其中每个权重 乘以一个因子 √ ,如式 2.1 所示: I W ( )其中,I是单位矩阵,除非特别指定,下文所使用的拉普拉斯矩阵都是归一化的版本。图的拉普拉斯矩阵 是对称的正定矩阵,有一组标准的正交完备特征向量集。特征向量 满足 ,其中, 是非负的实值(假定 < ≤ ≤ )。在矩阵的表达中,拉普拉斯矩阵可以采用奇异值分解方法分解成 U UT, ( )。类似于经典的傅里叶变换,一个空间域的信号 的图傅里叶正变换可以定义为: UT [78], 是变化后的傅里叶信号,其对应的图傅里叶反变换是: U 。
图 2-3 SFT 和经典的基于相关滤波方法的性能比较(无尺度)从图2-3中看出,基于深度特征的相关滤波VGG_CF跟踪器提取鲁棒的CNN特征,这使其在性能上明显优于其它两种基于相关滤波的方法(主要用传统的特征)。与基线的VGG_CF 的结果相比,本文提出的 SFT 跟踪器在 CLE(精确度)指标上高了 0.034,同时在 AUC(成功率)指标上获得 0.576 的分数,也超过 VGG_CF 跟踪器 0.028。这主要归结于两个方面的原因:(1)SFT 对空间区域进行局部滤波,(2)图的旋转不变性和平移不变性,具体将在本小节末尾进行更详细的分析。为了进行一个根本的比较,在这里没有加入尺度估计。在 OTB-2015 数据库上的实验结果比较:将本文提出的 SFT 跟踪算法与九个当前性能最优秀的跟踪器进行比较:DeepSRDCF[83],HDT[80],CCOT[84],MEEM[85],DSST[69],KCF[71],STRUCT[62],TLD[86],以及本文基准算法 VGG_CF。
【参考文献】:
期刊论文
[1]基于新模板匹配的运动目标跟踪算法[J]. 穆欣侃,徐德江,罗海波,石振刚. 火力与指挥控制. 2013(03)
[2]基于几何活动轮廓模型的目标跟踪与快速运动估计[J]. 罗嘉,韦志辉. 中国图象图形学报. 2009(07)
[3]基于mean-shift算法的人脸实时跟踪方法[J]. 蒋建国,孙洪艳,齐美彬. 计算机应用研究. 2008(07)
本文编号:3044232
【文章来源】:东南大学江苏省 211工程院校 985工程院校 教育部直属院校
【文章页数】:67 页
【学位级别】:硕士
【部分图文】:
谱滤波SFT跟踪算法流程图
由一组顶点 ( )和一组边 构成,邻接矩阵 表示连接的边上的正值权重。每个顶点与一个信号相关联,即多通道特征向量是从其对应的坐标位置上提取的,特征提取函数 定义了顶点的信号,其中 是信号的维度。在谱图理论中,最为关键的一个算子就是图的拉普拉斯算子 ,算子定义为 D ,其中D × 是对角度矩阵,即 。一个常用的算子是归一化后的图的拉普拉斯算子,其中每个权重 乘以一个因子 √ ,如式 2.1 所示: I W ( )其中,I是单位矩阵,除非特别指定,下文所使用的拉普拉斯矩阵都是归一化的版本。图的拉普拉斯矩阵 是对称的正定矩阵,有一组标准的正交完备特征向量集。特征向量 满足 ,其中, 是非负的实值(假定 < ≤ ≤ )。在矩阵的表达中,拉普拉斯矩阵可以采用奇异值分解方法分解成 U UT, ( )。类似于经典的傅里叶变换,一个空间域的信号 的图傅里叶正变换可以定义为: UT [78], 是变化后的傅里叶信号,其对应的图傅里叶反变换是: U 。
图 2-3 SFT 和经典的基于相关滤波方法的性能比较(无尺度)从图2-3中看出,基于深度特征的相关滤波VGG_CF跟踪器提取鲁棒的CNN特征,这使其在性能上明显优于其它两种基于相关滤波的方法(主要用传统的特征)。与基线的VGG_CF 的结果相比,本文提出的 SFT 跟踪器在 CLE(精确度)指标上高了 0.034,同时在 AUC(成功率)指标上获得 0.576 的分数,也超过 VGG_CF 跟踪器 0.028。这主要归结于两个方面的原因:(1)SFT 对空间区域进行局部滤波,(2)图的旋转不变性和平移不变性,具体将在本小节末尾进行更详细的分析。为了进行一个根本的比较,在这里没有加入尺度估计。在 OTB-2015 数据库上的实验结果比较:将本文提出的 SFT 跟踪算法与九个当前性能最优秀的跟踪器进行比较:DeepSRDCF[83],HDT[80],CCOT[84],MEEM[85],DSST[69],KCF[71],STRUCT[62],TLD[86],以及本文基准算法 VGG_CF。
【参考文献】:
期刊论文
[1]基于新模板匹配的运动目标跟踪算法[J]. 穆欣侃,徐德江,罗海波,石振刚. 火力与指挥控制. 2013(03)
[2]基于几何活动轮廓模型的目标跟踪与快速运动估计[J]. 罗嘉,韦志辉. 中国图象图形学报. 2009(07)
[3]基于mean-shift算法的人脸实时跟踪方法[J]. 蒋建国,孙洪艳,齐美彬. 计算机应用研究. 2008(07)
本文编号:3044232
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3044232.html