基于贝叶斯推理的人脸表情识别方法
发布时间:2021-07-12 22:52
随着科技的发展,“智能化”已渗入人们的日常生活。情感智能是人工智能研究领域中的重要内容,而其中的人脸表情识别技术在公共安全、医疗服务以及人机交互等领域的应用需求不断提升,因此基于图像的人脸表情识别是研究的热点之一。论文基于贝叶斯推理理论,针对其中的表情特征提取和分类问题开展相关研究,有着重要的理论和应用价值。论文的主要工作如下:首先,设计了两种人脸表情特征的提取方法。第一种方法提取了基于语义图像块的传统特征,该方法结合多尺度采样策略来生成语义图像块,并在此之上提取Dense SIFT和LBPHF特征,然后将两种特征进行融合。第二种方法提取了基于卷积神经网络的深度特征,该方法采用改进的VGG19网络,实现了有效的特征学习。其次,在语义图像块的传统特征之上,提出了基于贝叶斯主题模型的人脸表情识别方法。该方法通过分层处理的方式对语义图像块的特征进行了二次抽象。首先,在局部特征之上构造视觉词典,然后编码形成表情词汇特征,进而通过人脸主题模型的学习,得到潜在的表情主题特征,以此作为最终的识别向量。该方法在JAFFE数据集上获得了94.9%的准确率,并且在CK+数据集上的六类...
【文章来源】:华中科技大学湖北省 211工程院校 985工程院校 教育部直属院校
【文章页数】:80 页
【学位级别】:硕士
【部分图文】:
不同被试者在相同表情下的表现
华 中 科 技 大 学 硕 士 学 位 论 识别难点在于样本较少,且不同被试者的各个表情状态存在示,第一位女性在不同情绪下的面部变化幅度较小,而第二位。另外,该数据集中还含有少量的标注错误,如图 2-2 所示DI FE HA NE SA 图 2-1 不同被试者在相同表情下的表现
华 中 科 技 大 学 硕 士 学 位 论 文数据集上的评估算法并不统一。对于静态人脸表情识别,常用的数据选择方法取每个序列中包含峰值的若干帧。同时,由于 CO 类别样本较少,识别较为困难以不少方法在性能评估时,将此类排除在外。(3)FER2013 数据集FER2013[48]是由谷歌图像搜索 API 自动采集的大型人脸表情数据集,带有 7 情标签:AN,HA,SA,SU,DI,FE,NE。该数据集包含了 35887 个面部灰像,分辨率为 48×48 像素,这些图像一般可以直接用作表情识别,而无需再进脸检测。在 FER2013 数据集中,训练集的数目为 28709,“PublicTestSet”PrivateTestSet”的数目各为 3589,二者可以分别用作验证集和测试集,也可以于测试。从图 1-6 的样例可以看出,该数据集的图像在年龄、姿势和光照等方面很大,同时存在着遮挡的情况。另外,该数据集上的肉眼识别准确率仅为 65.5%
本文编号:3280804
【文章来源】:华中科技大学湖北省 211工程院校 985工程院校 教育部直属院校
【文章页数】:80 页
【学位级别】:硕士
【部分图文】:
不同被试者在相同表情下的表现
华 中 科 技 大 学 硕 士 学 位 论 识别难点在于样本较少,且不同被试者的各个表情状态存在示,第一位女性在不同情绪下的面部变化幅度较小,而第二位。另外,该数据集中还含有少量的标注错误,如图 2-2 所示DI FE HA NE SA 图 2-1 不同被试者在相同表情下的表现
华 中 科 技 大 学 硕 士 学 位 论 文数据集上的评估算法并不统一。对于静态人脸表情识别,常用的数据选择方法取每个序列中包含峰值的若干帧。同时,由于 CO 类别样本较少,识别较为困难以不少方法在性能评估时,将此类排除在外。(3)FER2013 数据集FER2013[48]是由谷歌图像搜索 API 自动采集的大型人脸表情数据集,带有 7 情标签:AN,HA,SA,SU,DI,FE,NE。该数据集包含了 35887 个面部灰像,分辨率为 48×48 像素,这些图像一般可以直接用作表情识别,而无需再进脸检测。在 FER2013 数据集中,训练集的数目为 28709,“PublicTestSet”PrivateTestSet”的数目各为 3589,二者可以分别用作验证集和测试集,也可以于测试。从图 1-6 的样例可以看出,该数据集的图像在年龄、姿势和光照等方面很大,同时存在着遮挡的情况。另外,该数据集上的肉眼识别准确率仅为 65.5%
本文编号:3280804
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3280804.html
最近更新
教材专著