多角度人脸表情图像生成与识别的研究与实现
发布时间:2021-02-26 01:10
多角度面部表情识别一直以来都是图像处理领域的难点之一。传统的面部表情识别大多是基于正面人脸表情图像。但在现实生活中,我们所获取的表情图像大多数是由不同角度的摄像机拍摄而成,各个角度的面部表情特征大有差别,使得计算机对于多角度面部表情的识别有较大困难。此外,目前主流的表情识别算法对正脸表情图像识别率较高,而对侧脸表情识别图像识别效果不佳,说明多角度面部表情识别是一个值得探究的课题。多角度表情识别面临着数据库较少,人工对其进行表情标注的代价较高等一系列问题。针对上述问题。本文采用了多特征融合的循环生成对抗网络(Multi-feature Fusion Cycle Generative Adversarial Networks,MFCGAN)来提高多角度面部表情识别的准确率和鲁棒性。该网络的设计思想在于在不使用侧脸表情类别标签的条件下,通过有标签的正脸图像获得一个能准确进行多角度侧脸表情判决的分类器。其中采用迁移学习的思想将不同角度的人脸表情特征映射到正脸表情特征空间中,并且改进了表情识别网络,提高多角度侧脸表情识别的正确率和鲁棒性,拥有巨大的发展前景。本文的研究内容如下:(1)详细介绍了生...
【文章来源】:南京邮电大学江苏省
【文章页数】:59 页
【学位级别】:硕士
【部分图文】:
迁移学习的基本思想迁移学习与多任务学习的区别在于,多任务学习是对目标域和源域一起共同学习,而迁
ages684basicexpressionshttps://www.ri.cmu.edu/publications/the-cmu-pose-EmotioNet[45]1,000,000imagesN/A23basicexpressionsorcompoundexpressionshttp://cbcsl.ece.ohio-state.edu/dbformemotionet.htmlJAFFE[46]213images106basicexpressionsplusneutralhttp://www.kasrl.org/jaffe.htmlCAS-PEAL[47]99594images10405basicexpressionshttp://www.jdl/ac.cn/peal/(1)CK+人脸表情库CK+人脸表情数据集[39]是在原来CohnKanade(CK)数据库的基础上发展而来,如图1.3所示。至此,CK数据库开始广泛地被各国研究学者用来对人脸表情识别进行分析。而CK+数据库在此基础上,将数据量增加了27%,序列数也增加了22%,并且还重新修改且验证了这些表情的标签。CK+数据集的志愿者都是年龄在18~30岁的青年学生。图像由593个图像序列组成,图像的开始和结束都是中性表情,中性表情指的是人平静下的面部表情。目前CK+数据库在人脸表情识别中应用非常广泛。图1.3来自ck+数据库的人脸表情图像
南京邮电大学专业学位硕士研究生学位论文第一章绪论10(2)RAFD人脸表情库RAFD[40](RadboudFacesDatabase)表情库,该库采集了67名志愿者(包括女性、男性、儿童)在指定环境下的8种常见表情(中性、开心、愤怒、厌恶、恐惧、悲伤、惊讶、蔑视),共1608张图像。每个表情都有来自5个不同方向的摄像机分别拍摄,角度包括0°,45°,90°,135°以及180°,如图1.4所示。图1.4RAFD数据库的人脸表情图像(3)Multi-PIE人脸表情数据集图1.5是美国卡耐基梅隆大学建立的Multi-PIE数据集。它是在CMU-PIE数据库的基础上进一步发展而来。Multi-PIE里面包含了337名受试者在角度不同的摄像机的拍摄下做出的七种不同表情,共包含1515张人脸数据,可以用于多角度人脸表情识别中。图1.5Multi-PIE人脸表情数据库(4)LFPW数据库2001年,美国卡内基梅隆大学创建的人脸数据库--LPFW数据库[48],该数据库中包含了trainset和testset两个子目录,trainset子目录下数据集作为训练数据,里面共有811张多角度人脸表情图片,另一个数据集testset里的样本集作为测试样本集,里面有224张各种角度的
本文编号:3051849
【文章来源】:南京邮电大学江苏省
【文章页数】:59 页
【学位级别】:硕士
【部分图文】:
迁移学习的基本思想迁移学习与多任务学习的区别在于,多任务学习是对目标域和源域一起共同学习,而迁
ages684basicexpressionshttps://www.ri.cmu.edu/publications/the-cmu-pose-EmotioNet[45]1,000,000imagesN/A23basicexpressionsorcompoundexpressionshttp://cbcsl.ece.ohio-state.edu/dbformemotionet.htmlJAFFE[46]213images106basicexpressionsplusneutralhttp://www.kasrl.org/jaffe.htmlCAS-PEAL[47]99594images10405basicexpressionshttp://www.jdl/ac.cn/peal/(1)CK+人脸表情库CK+人脸表情数据集[39]是在原来CohnKanade(CK)数据库的基础上发展而来,如图1.3所示。至此,CK数据库开始广泛地被各国研究学者用来对人脸表情识别进行分析。而CK+数据库在此基础上,将数据量增加了27%,序列数也增加了22%,并且还重新修改且验证了这些表情的标签。CK+数据集的志愿者都是年龄在18~30岁的青年学生。图像由593个图像序列组成,图像的开始和结束都是中性表情,中性表情指的是人平静下的面部表情。目前CK+数据库在人脸表情识别中应用非常广泛。图1.3来自ck+数据库的人脸表情图像
南京邮电大学专业学位硕士研究生学位论文第一章绪论10(2)RAFD人脸表情库RAFD[40](RadboudFacesDatabase)表情库,该库采集了67名志愿者(包括女性、男性、儿童)在指定环境下的8种常见表情(中性、开心、愤怒、厌恶、恐惧、悲伤、惊讶、蔑视),共1608张图像。每个表情都有来自5个不同方向的摄像机分别拍摄,角度包括0°,45°,90°,135°以及180°,如图1.4所示。图1.4RAFD数据库的人脸表情图像(3)Multi-PIE人脸表情数据集图1.5是美国卡耐基梅隆大学建立的Multi-PIE数据集。它是在CMU-PIE数据库的基础上进一步发展而来。Multi-PIE里面包含了337名受试者在角度不同的摄像机的拍摄下做出的七种不同表情,共包含1515张人脸数据,可以用于多角度人脸表情识别中。图1.5Multi-PIE人脸表情数据库(4)LFPW数据库2001年,美国卡内基梅隆大学创建的人脸数据库--LPFW数据库[48],该数据库中包含了trainset和testset两个子目录,trainset子目录下数据集作为训练数据,里面共有811张多角度人脸表情图片,另一个数据集testset里的样本集作为测试样本集,里面有224张各种角度的
本文编号:3051849
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3051849.html
最近更新
教材专著