基于局部幅值编码的人脸表情识别
发布时间:2022-01-10 05:34
人脸表情是情感感知最直接的的载体和情感表达最明显的方式。作为智能机器人,我们希望它们拥有友好的外表更希望他们具有像人一样的情感感知能力和表达能力。虽然目前已经出现了很多经典有效的人脸表情识别算法,但对人脸表情识别的研究仍未进入成熟阶段。综上,研究人脸表情识别算法对提高智能机器人的友好交互能力具有重要的理论意义和实用价值。本文主要从特征提取和分类识别两方面进行了探究和实验,在经典的局部纹理特征提取算法和局部几何特征提取算法的基础上进行了改进,在分类识别的设计上将元辅助学习网络和SVM进行结合。具体工作如下:(1)本文第三章提出了一个新的特征描述符,即中心对称局部符号幅值模式(CS-LSMP)。和传统的特征提取算法局部二值模式(LBP)相比,CS-LSMP算子不仅考虑了局部区域的符号信息,而且考虑了局部差异的幅度信息,同时还大大地降低了特征维度。除此之外,为了降低单一特征提取算法的限制和更加充分的利用不同特征的优势,分别提取方向幅值特征图(OMFMs)、正负幅值特征图(PNMFMs)和Gabor特征图(GFMs)的CS-LSMP特征,然后将这些特征进行级联形成融合特征。OMFMs与梯度方向...
【文章来源】:合肥工业大学安徽省 211工程院校 教育部直属院校
【文章页数】:77 页
【学位级别】:硕士
【部分图文】:
JAFFE数据库中一位受试者的7种表情图像
第一章绪论集,但是却包含了不同肤色、性别、年龄的差异。图1.2展示了CK数据库中一位志愿者的6种表情图像。图1.2CK数据库中一位志愿者的6种表情图像Fig1.2SixkindsofexpressionimagesofavolunteerintheCKdatabase(3)MMI(ManMachineInteraction)表情库MMI面部表情数据库是一个正在进行的项目,旨在向面部表情分析社区提供大量面部表情的视觉数据。在自动人类行为分析领域,阻碍其新的发展,尤其是在影响识别方面,的一个主要问题是缺乏显示行为和影响的数据库。为了解决这个问题,MMI面部表情数据库于2002年被构想为构建和评估面部表情识别算法的资源。该面部表情数据库中包含2900多个视频和75个受试者的高分辨率静态图像,其中每个视频序列包含了面部表情的完整时间模式的记录,即从中性表情开始变化到某种基本表情的峰值然后再逐渐恢复为中性表情结束。最近该库中还增加了最近自然表情的录音。由于该数据库中参与者姿态、肤色、年龄差异较大,且部分参与者面部还含有遮挡物,如眼镜等,因此在MMI数据库上进行表情识别存在挑战性。图1.3展示了MMI数据库中一位参与者的6种表情图像。图1.3MMI数据库中一位参与者的6种表情图像Fig1.3SixkindsofexpressionimagesofaparticipantintheMMIdatabase(4)AFEW及SFEW数据库AFEW(ActedFacialExpressionsintheWild)数据库是一个动态的贴近现实情况的面部表情数据库,该数据库由电影中提取的接近真实世界环境的包含表情的视频片段组成,它包含六类基本表情和中性表情。AFEW是在“聋人和听力障碍者的字幕”(SDH)和“隐藏式字幕”(CC)的基础上收集的,目的是搜索与表情相关的内容,并提取一些有代表意义的面部运动视频片段所对应的时间戳。该数据库包含1~70岁的较大年龄段对象,并且剪辑的相
私饩稣飧鑫?题,MMI面部表情数据库于2002年被构想为构建和评估面部表情识别算法的资源。该面部表情数据库中包含2900多个视频和75个受试者的高分辨率静态图像,其中每个视频序列包含了面部表情的完整时间模式的记录,即从中性表情开始变化到某种基本表情的峰值然后再逐渐恢复为中性表情结束。最近该库中还增加了最近自然表情的录音。由于该数据库中参与者姿态、肤色、年龄差异较大,且部分参与者面部还含有遮挡物,如眼镜等,因此在MMI数据库上进行表情识别存在挑战性。图1.3展示了MMI数据库中一位参与者的6种表情图像。图1.3MMI数据库中一位参与者的6种表情图像Fig1.3SixkindsofexpressionimagesofaparticipantintheMMIdatabase(4)AFEW及SFEW数据库AFEW(ActedFacialExpressionsintheWild)数据库是一个动态的贴近现实情况的面部表情数据库,该数据库由电影中提取的接近真实世界环境的包含表情的视频片段组成,它包含六类基本表情和中性表情。AFEW是在“聋人和听力障碍者的字幕”(SDH)和“隐藏式字幕”(CC)的基础上收集的,目的是搜索与表情相关的内容,并提取一些有代表意义的面部运动视频片段所对应的时间戳。该数据库包含1~70岁的较大年龄段对象,并且剪辑的相关信息如姓名、演员年龄、角色年龄、姿势、性别、人物表情以及整个剪辑片段所代表的表情等都存储在一个可扩展的XML模式中。SFEW(StaticFacialExpressionintheWild)数据库是从AFEW库5
【参考文献】:
期刊论文
[1]基于跨连接LeNet-5网络的面部表情识别[J]. 李勇,林小竹,蒋梦莹. 自动化学报. 2018(01)
[2]基于梯度Gabor直方图特征的表情识别方法[J]. 胡敏,朱弘,王晓华,许良凤. 计算机辅助设计与图形学学报. 2013(12)
[3]人脸检测研究综述[J]. 梁路宏,艾海舟,徐光祐,张钹. 计算机学报. 2002(05)
硕士论文
[1]基于生成对抗网络的人脸表情识别方法研究[D]. 余胜男.合肥工业大学 2019
[2]基于LBP特征与深度学习模型的人脸表情识别研究[D]. 蔡建峰.南昌大学 2016
本文编号:3580145
【文章来源】:合肥工业大学安徽省 211工程院校 教育部直属院校
【文章页数】:77 页
【学位级别】:硕士
【部分图文】:
JAFFE数据库中一位受试者的7种表情图像
第一章绪论集,但是却包含了不同肤色、性别、年龄的差异。图1.2展示了CK数据库中一位志愿者的6种表情图像。图1.2CK数据库中一位志愿者的6种表情图像Fig1.2SixkindsofexpressionimagesofavolunteerintheCKdatabase(3)MMI(ManMachineInteraction)表情库MMI面部表情数据库是一个正在进行的项目,旨在向面部表情分析社区提供大量面部表情的视觉数据。在自动人类行为分析领域,阻碍其新的发展,尤其是在影响识别方面,的一个主要问题是缺乏显示行为和影响的数据库。为了解决这个问题,MMI面部表情数据库于2002年被构想为构建和评估面部表情识别算法的资源。该面部表情数据库中包含2900多个视频和75个受试者的高分辨率静态图像,其中每个视频序列包含了面部表情的完整时间模式的记录,即从中性表情开始变化到某种基本表情的峰值然后再逐渐恢复为中性表情结束。最近该库中还增加了最近自然表情的录音。由于该数据库中参与者姿态、肤色、年龄差异较大,且部分参与者面部还含有遮挡物,如眼镜等,因此在MMI数据库上进行表情识别存在挑战性。图1.3展示了MMI数据库中一位参与者的6种表情图像。图1.3MMI数据库中一位参与者的6种表情图像Fig1.3SixkindsofexpressionimagesofaparticipantintheMMIdatabase(4)AFEW及SFEW数据库AFEW(ActedFacialExpressionsintheWild)数据库是一个动态的贴近现实情况的面部表情数据库,该数据库由电影中提取的接近真实世界环境的包含表情的视频片段组成,它包含六类基本表情和中性表情。AFEW是在“聋人和听力障碍者的字幕”(SDH)和“隐藏式字幕”(CC)的基础上收集的,目的是搜索与表情相关的内容,并提取一些有代表意义的面部运动视频片段所对应的时间戳。该数据库包含1~70岁的较大年龄段对象,并且剪辑的相
私饩稣飧鑫?题,MMI面部表情数据库于2002年被构想为构建和评估面部表情识别算法的资源。该面部表情数据库中包含2900多个视频和75个受试者的高分辨率静态图像,其中每个视频序列包含了面部表情的完整时间模式的记录,即从中性表情开始变化到某种基本表情的峰值然后再逐渐恢复为中性表情结束。最近该库中还增加了最近自然表情的录音。由于该数据库中参与者姿态、肤色、年龄差异较大,且部分参与者面部还含有遮挡物,如眼镜等,因此在MMI数据库上进行表情识别存在挑战性。图1.3展示了MMI数据库中一位参与者的6种表情图像。图1.3MMI数据库中一位参与者的6种表情图像Fig1.3SixkindsofexpressionimagesofaparticipantintheMMIdatabase(4)AFEW及SFEW数据库AFEW(ActedFacialExpressionsintheWild)数据库是一个动态的贴近现实情况的面部表情数据库,该数据库由电影中提取的接近真实世界环境的包含表情的视频片段组成,它包含六类基本表情和中性表情。AFEW是在“聋人和听力障碍者的字幕”(SDH)和“隐藏式字幕”(CC)的基础上收集的,目的是搜索与表情相关的内容,并提取一些有代表意义的面部运动视频片段所对应的时间戳。该数据库包含1~70岁的较大年龄段对象,并且剪辑的相关信息如姓名、演员年龄、角色年龄、姿势、性别、人物表情以及整个剪辑片段所代表的表情等都存储在一个可扩展的XML模式中。SFEW(StaticFacialExpressionintheWild)数据库是从AFEW库5
【参考文献】:
期刊论文
[1]基于跨连接LeNet-5网络的面部表情识别[J]. 李勇,林小竹,蒋梦莹. 自动化学报. 2018(01)
[2]基于梯度Gabor直方图特征的表情识别方法[J]. 胡敏,朱弘,王晓华,许良凤. 计算机辅助设计与图形学学报. 2013(12)
[3]人脸检测研究综述[J]. 梁路宏,艾海舟,徐光祐,张钹. 计算机学报. 2002(05)
硕士论文
[1]基于生成对抗网络的人脸表情识别方法研究[D]. 余胜男.合肥工业大学 2019
[2]基于LBP特征与深度学习模型的人脸表情识别研究[D]. 蔡建峰.南昌大学 2016
本文编号:3580145
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3580145.html
最近更新
教材专著