基于层次结构化字典学习的人脸表情识别
发布时间:2019-10-23 12:28
【摘要】:针对传统稀疏表示方法构建的字典不具备判别性的问题,以K-SVD算法为基础,对判别字典的构建和分类求解进行了研究,提出一种基于层次结构化字典学习的表情识别方法。先将训练样本切割出眼眉、脸颊和嘴三部分,对分割的各部分利用K-SVD算法得到块字典向量,再用层次分析法的权重赋值方法求块字典向量的权重值,构成各类子字典。将所有的子字典进行联合,用结构化字典学习算法求解。测试样本的归类取决于求解结果重构的效果。在JAFFE和CK表情库上的实验表明,该算法在保证了字典判别性的同时,也达到了较高的识别率。
【图文】:
过联合层次分析法构建的子字典组合初始化字典D(0)。为了判别测试样本的类别,结合上述构造的结构化字典D以及求解目标函数最优解xT=(x[1]T,x[2]T,…,x[C]T),对测试样本进行重构,,哪类子字典能最好地重构测试样本,便将测试样本归为对应的类别。具体分类公式如下所示:miniri(y)=‖y-D[i]x[i]‖22(14)2实验设计及结果分析2.1实验设计实验步骤如下:a)对JAFFE数据库中的图像进行预处理,把大小为256×256的原图手动地裁剪成大小为96×96的效果图,预处理效果如图1所示。b)为了更好地找寻小的子字典模块来稀疏结构化子字典,将a)中预处理之后的效果图分割成三个部分,分割后的结果示意图如图2所示。图1预处理效果图2分割示意图c)对各类训练样本分割后的三个部分使用近邻法分别算出各自的识别率以及用K-SVD算法得到各个部分的块字典向量。d)利用层次分析法以及对应的权重赋值方法构建各类表情的子字典,并且组合七个子字典,构建初始化字典D(0)。e)利用结构化字典算法以及OMP算法求解,求出结构化字典D=[D[1],…,D[7]]以及目标函数的最优解xT=(x[1]T,x[2]T,…,x[7]T)。f)最后根据式(14)对测试样本进行最后的分类。2.2结果分析JAFFE表情数据库是由10名日本年轻女性的213张表情图像组成,每个人都有七种表情,包括高兴、恐惧、愤怒、惊奇、伤心、厌恶以及中性,每个人每一种表情平均有三张图片。在本文的实验中,实验数据集的训练样本和测试样本采用不同的人脸图像集,每个人每一类表情图像中随机选取其中一张图像作为训练样本,总共有70张,剩下的随机选取每个人每类表情两张图片共140张作为?
解xT=(x[1]T,x[2]T,…,x[C]T),对测试样本进行重构,哪类子字典能最好地重构测试样本,便将测试样本归为对应的类别。具体分类公式如下所示:miniri(y)=‖y-D[i]x[i]‖22(14)2实验设计及结果分析2.1实验设计实验步骤如下:a)对JAFFE数据库中的图像进行预处理,把大小为256×256的原图手动地裁剪成大小为96×96的效果图,预处理效果如图1所示。b)为了更好地找寻小的子字典模块来稀疏结构化子字典,将a)中预处理之后的效果图分割成三个部分,分割后的结果示意图如图2所示。图1预处理效果图2分割示意图c)对各类训练样本分割后的三个部分使用近邻法分别算出各自的识别率以及用K-SVD算法得到各个部分的块字典向量。d)利用层次分析法以及对应的权重赋值方法构建各类表情的子字典,并且组合七个子字典,构建初始化字典D(0)。e)利用结构化字典算法以及OMP算法求解,求出结构化字典D=[D[1],…,D[7]]以及目标函数的最优解xT=(x[1]T,x[2]T,…,x[7]T)。f)最后根据式(14)对测试样本进行最后的分类。2.2结果分析JAFFE表情数据库是由10名日本年轻女性的213张表情图像组成,每个人都有七种表情,包括高兴、恐惧、愤怒、惊奇、伤心、厌恶以及中性,每个人每一种表情平均有三张图片。在本文的实验中,实验数据集的训练样本和测试样本采用不同的人脸图像集,每个人每一类表情图像中随机选取其中一张图像作为训练样本,总共有70张,剩下的随机选取每个人每类表情两张图片共140张作为训练样本,重复三次,最后的结果取三次的平均值。根据实验设计中的图像预处理和分割方法,对训练和测试图像进行相关的处理,然后
【作者单位】: 广东工业大学计算机学院;
【基金】:广东省交通运输厅科技项目(科技-2016-02-030) 广东省自然科学基金博士启动项目(2014A030310169);广东省自然科学基金面上项目(2016A030313703);广东省自然科学基金资助项目(2016A030313713) 广东省科技计划资助项目(2016B030305002)
【分类号】:TP391.41
【图文】:
过联合层次分析法构建的子字典组合初始化字典D(0)。为了判别测试样本的类别,结合上述构造的结构化字典D以及求解目标函数最优解xT=(x[1]T,x[2]T,…,x[C]T),对测试样本进行重构,,哪类子字典能最好地重构测试样本,便将测试样本归为对应的类别。具体分类公式如下所示:miniri(y)=‖y-D[i]x[i]‖22(14)2实验设计及结果分析2.1实验设计实验步骤如下:a)对JAFFE数据库中的图像进行预处理,把大小为256×256的原图手动地裁剪成大小为96×96的效果图,预处理效果如图1所示。b)为了更好地找寻小的子字典模块来稀疏结构化子字典,将a)中预处理之后的效果图分割成三个部分,分割后的结果示意图如图2所示。图1预处理效果图2分割示意图c)对各类训练样本分割后的三个部分使用近邻法分别算出各自的识别率以及用K-SVD算法得到各个部分的块字典向量。d)利用层次分析法以及对应的权重赋值方法构建各类表情的子字典,并且组合七个子字典,构建初始化字典D(0)。e)利用结构化字典算法以及OMP算法求解,求出结构化字典D=[D[1],…,D[7]]以及目标函数的最优解xT=(x[1]T,x[2]T,…,x[7]T)。f)最后根据式(14)对测试样本进行最后的分类。2.2结果分析JAFFE表情数据库是由10名日本年轻女性的213张表情图像组成,每个人都有七种表情,包括高兴、恐惧、愤怒、惊奇、伤心、厌恶以及中性,每个人每一种表情平均有三张图片。在本文的实验中,实验数据集的训练样本和测试样本采用不同的人脸图像集,每个人每一类表情图像中随机选取其中一张图像作为训练样本,总共有70张,剩下的随机选取每个人每类表情两张图片共140张作为?
解xT=(x[1]T,x[2]T,…,x[C]T),对测试样本进行重构,哪类子字典能最好地重构测试样本,便将测试样本归为对应的类别。具体分类公式如下所示:miniri(y)=‖y-D[i]x[i]‖22(14)2实验设计及结果分析2.1实验设计实验步骤如下:a)对JAFFE数据库中的图像进行预处理,把大小为256×256的原图手动地裁剪成大小为96×96的效果图,预处理效果如图1所示。b)为了更好地找寻小的子字典模块来稀疏结构化子字典,将a)中预处理之后的效果图分割成三个部分,分割后的结果示意图如图2所示。图1预处理效果图2分割示意图c)对各类训练样本分割后的三个部分使用近邻法分别算出各自的识别率以及用K-SVD算法得到各个部分的块字典向量。d)利用层次分析法以及对应的权重赋值方法构建各类表情的子字典,并且组合七个子字典,构建初始化字典D(0)。e)利用结构化字典算法以及OMP算法求解,求出结构化字典D=[D[1],…,D[7]]以及目标函数的最优解xT=(x[1]T,x[2]T,…,x[7]T)。f)最后根据式(14)对测试样本进行最后的分类。2.2结果分析JAFFE表情数据库是由10名日本年轻女性的213张表情图像组成,每个人都有七种表情,包括高兴、恐惧、愤怒、惊奇、伤心、厌恶以及中性,每个人每一种表情平均有三张图片。在本文的实验中,实验数据集的训练样本和测试样本采用不同的人脸图像集,每个人每一类表情图像中随机选取其中一张图像作为训练样本,总共有70张,剩下的随机选取每个人每类表情两张图片共140张作为训练样本,重复三次,最后的结果取三次的平均值。根据实验设计中的图像预处理和分割方法,对训练和测试图像进行相关的处理,然后
【作者单位】: 广东工业大学计算机学院;
【基金】:广东省交通运输厅科技项目(科技-2016-02-030) 广东省自然科学基金博士启动项目(2014A030310169);广东省自然科学基金面上项目(2016A030313703);广东省自然科学基金资助项目(2016A030313713) 广东省科技计划资助项目(2016B030305002)
【分类号】:TP391.41
【相似文献】
相关期刊论文 前10条
1 王志良,陈锋军,薛为民;人脸表情识别方法综述[J];计算机应用与软件;2003年12期
2 孙蔚;王波;;人脸表情识别综述[J];电脑知识与技术;2012年01期
3 杨梅娟;;人脸表情识别综述[J];甘肃科技;2006年04期
4 刘晓e
本文编号:2552108
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2552108.html