当前位置:主页 > 科技论文 > 信息工程论文 >

融合说话人识别和人脸识别的身份认证

发布时间:2017-09-19 16:39

  本文关键词:融合说话人识别和人脸识别的身份认证


  更多相关文章: 身份认证 说话人识别 人脸识别 GMM 决策层融合


【摘要】:在个人身份信息安全问题突显的今天,单模态生物特征下的身份认证技术因其自身的局限性,已经不能够满足人们的需要。利用多模态生物特征进行身份认证的技术已成为当今社会的研究热点。论文实现了说话人识别和人脸识别,并根据语音的信噪比和外界光照条件在决策层对说话人识别的结果和人脸识别的结果进行融合,以提高身份认证的正确率,从而弥补说话人识别和人脸识别对环境噪声和环境光照条件的不同要求。论文的主要工作如下:1、实现了说话人识别。采用基于高斯混合模型(Gaussian Mixture Model,GMM)的说话人识别方法,对不同说话人的训练语料经过预加重、分帧、加窗后,提取训练语料的梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficient,MFCC)作为特征向量,训练得到每个说话人的声学模型,组成所有说话人的GMM模型库。在识别阶段,对输入的待识别说话人的语音信号,提取声学特征MFCC,并将特征向量与GMM模型库进行匹配,并根据匹配概率获得识别结果。实验结果表明,本文实现的说话人识别能够在纯净语音下达到92.8%的识别率。2、实现了人脸识别。采用GMM分类器进行人脸识别。在训练阶段,首先对人脸进行图像预处理,然后采用基于肤色人脸区域检测方法完成人脸检测,接着对人脸图像进行归一化,并采用基于主成分分析的特征提取算法提取人脸特征,最后根据特征训练得到每个人的GMM,从而生成GMM人脸模型库。识别阶段,对识别者的人脸图像经过人脸检测和特征提取后,将得到的人脸特征向量与GMM人脸模型库进行概率匹配,设定系统分类阈值后,获得识别结果。实验表明,本文实现的人脸识别能够在人脸图像高信噪比的条件下达到78.1%的识别率。3、实现了融合说话人识别和人脸识别的身份认证。采用决策层融合方法,将说话人识别和人脸识别的识别结果进行融合得到融合后的识别结果。设定了外界语音信号的信噪比阈值和图像亮度平均值阈值,采用分段式处理方法获得融合权重。当语音信号信噪比小于信噪比阈值,则身份认证依靠人脸识别完成;当外界图像亮度平均值小于亮度平均值阈值,则身份认证依靠说话人识别完成。实验结果表明,在高信噪比且良好光照的情况下,融合后的平均识别正确率比单独的说话人识别正确率提高了1.55%,比单独的人脸识别正确率提高了17.41%。在低信噪比且光照条件差的情况下融合后的平均识别正确率比单独人脸识别正确率提高了73.22%。
【关键词】:身份认证 说话人识别 人脸识别 GMM 决策层融合
【学位授予单位】:西北师范大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP391.41;TN912.34
【目录】:
  • 摘要4-5
  • Abstract5-9
  • 第1章 绪论9-14
  • 1.1 研究背景及意义9-11
  • 1.2 研究现状11-12
  • 1.3 研究内容和结构12-14
  • 1.3.1 论文的主要内容12
  • 1.3.2 论文的结构安排12-14
  • 第2章 说话人识别技术14-21
  • 2.1 说话人识别基本概念14-15
  • 2.1.1 按目标不同分类14
  • 2.1.2 按内容不同分类14-15
  • 2.2 原理结构及特征参数15-18
  • 2.2.1 LPCC特征参数15-16
  • 2.2.2 MFCC特征参数16-18
  • 2.3 说话人识别常用方法18-20
  • 2.3.1 基于模板匹配的方法18
  • 2.3.2 基于概率模型的方法18-20
  • 2.3.3 基于判决模型的方法20
  • 2.4 本章小结20-21
  • 第3章 人脸识别技术21-28
  • 3.1 人脸识别基本概念21
  • 3.2 人脸识别的基本原理21-24
  • 3.3 人脸识别方法的分类24
  • 3.4 人脸识别常用方法24-27
  • 3.4.1 基于PCA人脸识别方法24-25
  • 3.4.2 基于SVD人脸识别方法25-26
  • 3.4.3 基于HMM人脸识别方法26
  • 3.4.4 基于神经网络的人脸识别方法26-27
  • 3.5 高斯混合模型分类器27
  • 3.6 本章小结27-28
  • 第4章 融合方法28-32
  • 4.1 融合概念28
  • 4.2 融合层级28-29
  • 4.3 融合方法权重匹配29-31
  • 4.4 本章小结31-32
  • 第5章 实验及评测32-46
  • 5.1 实验框架32-33
  • 5.2 实验过程33-37
  • 5.2.1 说话人识别部分33-35
  • 5.2.2 人脸识别部分35-36
  • 5.2.3 数据融合部分36-37
  • 5.3 实验结果37-45
  • 5.3.1 说话人识别37-39
  • 5.3.2 人脸识别39-41
  • 5.3.3 实验结果分析41-45
  • 5.4 本章小结45-46
  • 第6章 总结与展望46-48
  • 6.1 工作总结46-47
  • 6.2 进一步工作展望47-48
  • 参考文献48-51
  • 攻读学位期间的研究成果51-52
  • 致谢52

【相似文献】

中国期刊全文数据库 前10条

1 石艳;王晓晔;;新颖检测法在说话人识别技术中的应用[J];现代计算机(专业版);2008年07期

2 刘雪燕;张娜;袁宝玲;;说话人识别综述[J];电脑知识与技术;2009年01期

3 邱政权;范小春;王俊年;;基于动态环境下的说话人识别[J];科学技术与工程;2010年02期

4 单进;;说话人识别技术研究[J];科技资讯;2010年21期

5 申志生;于明;;说话人识别算法的定点DSP实现[J];单片机与嵌入式系统应用;2011年03期

6 谢建勋;;浅谈说话人识别技术[J];电脑知识与技术;2011年11期

7 安茂波;刘建;;一个快速说话人识别系统的设计和实现[J];网络新媒体技术;2012年03期

8 杨迪;戚银城;刘明军;张华芳子;武军娜;;说话人识别综述[J];电子科技;2012年06期

9 武光利;;说话人识别方法概述[J];硅谷;2012年19期

10 曹业敏,侯风雷,王炳锡;说话人识别技术现状与进展[J];河南科技;1998年09期

中国重要会议论文全文数据库 前10条

1 鲍福良;方志刚;徐洁;;说话人识别综述[A];第六届全国信息获取与处理学术会议论文集(2)[C];2008年

2 孙帆;迟惠生;;循环网络说话人识别[A];第二届全国人机语音通讯学术会议论文集[C];1992年

3 肖剑;欧贵文;;多层前馈神经网络组的文本无关说话人识别[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年

4 张玲华;郑宝玉;杨震;;模糊超椭球聚类算法及其在说话人识别中的应用研究[A];第八届全国人机语音通讯学术会议论文集[C];2005年

5 王宏;潘金贵;;基于矩阵正态分布的文本有关说话人识别[A];2007通信理论与技术新发展——第十二届全国青年通信学术会议论文集(上册)[C];2007年

6 戴红霞;赵力;;文本无关说话人识别系统的研究[A];2007’促进西部发展声学学术交流会论文集[C];2007年

7 陈联武;郭武;戴礼荣;;说话人识别系统中多样训练的应用[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年

8 崔玉红;胡光锐;;基于神经网络特征维数压缩方法及其在说话人识别中的应用[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年

9 吴丽丽;;基于仿生模式识别的说话人识别学习模型研究[A];第二届中国科学院博士后学术年会暨高新技术前沿与发展学术会议程序册[C];2010年

10 张晶;董金明;冯文全;;说话人识别系统研究与实现[A];全国第二届信号处理与应用学术会议专刊[C];2008年

中国重要报纸全文数据库 前2条

1 汪永安;科大讯飞说话人识别技术世界领先[N];安徽日报;2008年

2 吴长锋;科大讯飞勇夺说话人识别国际大赛第一[N];科技日报;2008年

中国博士学位论文全文数据库 前10条

1 单振宇;情感说话人识别及其解决方法的研究[D];浙江大学;2010年

2 别凡虎;说话人识别中区分性问题的研究[D];清华大学;2015年

3 谢怡宁;基于稀疏编码的鲁棒说话人识别方法研究[D];哈尔滨理工大学;2016年

4 安冬;噪声背景下说话人识别的若干关键问题研究[D];东北大学;2013年

5 吴迪;低信噪比环境下说话人识别研究[D];苏州大学;2016年

6 陆伟;基于缺失特征的文本无关说话人识别鲁棒性研究[D];中国科学技术大学;2008年

7 刘镝;说话人识别中信息融合算法的研究[D];北京交通大学;2011年

8 付中华;说话人识别系统鲁棒性研究[D];西北工业大学;2004年

9 林琳;基于模糊聚类与遗传算法的说话人识别理论研究及应用[D];吉林大学;2007年

10 邱政权;在噪声环境下的说话人识别[D];华南理工大学;2007年

中国硕士学位论文全文数据库 前10条

1 丛菡菡;基于支持相量机的稳键说话人识别[D];电子科技大学;2008年

2 任舒彬;面向手持应用的说话人识别算法研究[D];浙江大学;2006年

3 申志生;文本相关说话人识别嵌入式系统及其关键技术研究[D];河北工业大学;2011年

4 汪q,

本文编号:882779


资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/882779.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户6e6cd***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com