当前位置:主页 > 科技论文 > 信息工程论文 >

语音声纹密码验证技术研究

发布时间:2017-08-23 19:22

  本文关键词:语音声纹密码验证技术研究


  更多相关文章: 语音声纹密码 深度神经网络 特征端因子分析 差异因子 高斯混合模型


【摘要】:语音声纹密码是采用语音段中的文本信息和说话人信息对用户信息进行双重加密的技术。因此具有较好的安全性和便捷性,在银行、公安、智能家居等领域都有广泛的应用。但是在实际应用中,传统的语音声纹密码识别仍然面临着密码泄露、特征冗余、抗干扰性差等方面所带来的挑战。传统的语音声纹密码识别属于文本相关的声纹识别任务。由于密码文本是固定的,容易遗忘和泄露,因此安全性不高。针对这个问题,本文采用文本提示型的语音声纹密码识别方案。用户每次登陆系统时系统会提示输入的动态密码,用户根据提示文本说出密码语音。这种方法安全性虽然高但动态声纹密码识别属于文本无关的声纹识别任务其声纹识别性能相对较低。针对以上各个问题,本文主要从以下几个方面来提升文本提示型语音声纹密码的识别率。首先,语音声纹密码识别系统包含语音密码识别和声纹密码识别两个部分。因此系统前端需要一个识别率相对较高的语音识别系统来验证用户所说密码是否正确。传统基于GMM-HMM的语音密码识别系统识别率相对较低难以满足安全性要求,因此本文采用识别性能更好的DNN-HMM语音密码识别系统。第二、传统声纹识别中采用的声学特征(如MFCC,PLP等特征)包含的主要是文本信息和信道信息,说话人信息属于其中的弱信息。声纹密码识别性能极易受到语音信号中的文本、信道以及噪声等干扰信息的影响。针对这个问题,本文利用深度神经网络的特征提取能力提出一种基于深度神经网络的说话人信息提取方法。采用该方法提取出的说话人信息相对传统声学特征具有更好的说话人区分能力。第三、同样针对传统声学特征中包含的冗余信息,本文进一步采用特征端因子分析的方法来去除声学特征中的冗余干扰信息。传统的特征端因子分析方法是在高斯混合模型的每个高斯上借用因子分析思想来对特征降维。但GMM模型属于无监督的聚类算法,其每个高斯成分物理意义不够明确无法与具体的发音文本信息相对应。为解决这一问题,本文在特征端因子分析中利用语音识别中的声学模型深度神经网络取代高斯混合模型,分别对不同音素上的语音特征进行分类然后在每个音素子空间内实现对特征降维,提取出说话人信息并用于提取DNNi-vector。接着在基于DNN的说话人信息提取中,本文采用基于DNN的特征端因子分析取代LDA对每帧语音的隐层输出超矢量进行降维。最后根据文本提示型的声纹密码识别的特点,本文提出分数字建模声纹密码识别方案。针对数字声纹密码中的每个数字分别训练一个声纹识别模型。注册和测试时匹配同时出现的数字进行测试,将文本无关声纹密码识别任务转化为文本相关声纹密码识别任务。本文实验采用的数据库为RSR2015数据,通过在该数据库上的实验验证以上所述算法的有效性。
【关键词】:语音声纹密码 深度神经网络 特征端因子分析 差异因子 高斯混合模型
【学位授予单位】:中国科学技术大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TN912.34
【目录】:
  • 摘要5-7
  • ABSTRACT7-14
  • 主要符号对照表14-15
  • 第1章 绪论15-23
  • 1.1 语音声纹密码的研究背景15-17
  • 1.2 语音声纹密码的国内外研究现状17-18
  • 1.3 语音声纹密码系统的框架18-20
  • 1.4 语音声纹密码的性能评价指标20-21
  • 1.5 论文的研究内容21-22
  • 1.6 论文的结构安排22-23
  • 第2章 基于DNN-HMM的语音密码识别系统23-33
  • 2.1 引言23
  • 2.2 声学模型深度神经网络原理23-29
  • 2.2.1 深度神经网络结构23-25
  • 2.2.2 深度神经网络的参数训练25-27
  • 2.2.3 基于DNN-HMM的语音密码识别27-29
  • 2.3 语音声纹密码识别的数据库29-30
  • 2.4 实验结果及分析30-31
  • 2.4.1 实验步骤及配置30
  • 2.4.2 实验结果分析30-31
  • 2.5 本章小结31-33
  • 第3章 基于深度神经网络提取说话人信息33-45
  • 3.1 引言33
  • 3.2 全差异空间因子建模33-37
  • 3.2.1 全差异空间因子分析原理33-35
  • 3.2.2 TV模型信道补偿方法35-37
  • 3.3 采用深度神经网络提取说话人信息37-40
  • 3.3.1 说话人信息提取原理37-39
  • 3.3.2 说话S-vector注册和测试算法39-40
  • 3.4 实验结果及分析40-44
  • 3.4.1 S-vector说话人区分性分析40-41
  • 3.4.2 RSR2015 PartⅠ声纹识别实验41-42
  • 3.4.3 RSR2015 PartⅢ数字密码声纹识别实验42-44
  • 3.5 本章小结44-45
  • 第4章 基于深度神经网络的特征端因子分析45-59
  • 4.1 引言45-46
  • 4.2 基于GMM的特征端因子分析46-48
  • 4.3 基于DNN的特征端因子分析48-52
  • 4.3.1 基于DNN的i-vector技术48-50
  • 4.3.2 基于DNN的特征端因子分析50-52
  • 4.4 基于DNN的特征端因子分析在S-vector中的应用52-53
  • 4.5 实验结果及分析53-56
  • 4.5.1 基于DNN的特征端因子分析在MFCC特征中的应用53-56
  • 4.5.2 基于DNN的特征端因子分析在S-vector中的应用56
  • 4.6 本章小结56-59
  • 第5章 分数字建模声纹识别技术研究59-65
  • 5.1 引言59-60
  • 5.2 分词建模声纹识别原理60-61
  • 5.3 实验结果及分析61-64
  • 5.3.1 基于GMM的分词建模实验61-63
  • 5.3.2 基于DNN的分词建模实验63-64
  • 5.4 本章小结64-65
  • 第6章 总结与展望65-67
  • 6.1 论文总结65-66
  • 6.2 研究展望66-67
  • 参考文献67-73
  • 致谢73-75
  • 在读期间发表的学术论文与取得的研究成果75

【相似文献】

中国期刊全文数据库 前10条

1 ;得意声纹加密钥匙[J];信息网络安全;2004年10期

2 王英利;论声纹鉴定中复合韵母和鼻韵母中音素间连接形态特征[J];警察技术;2001年05期

3 李敬阳;胡国平;王莉;;声纹自动识别技术与声纹库建设应用[J];警察技术;2012年04期

4 深度;;声纹 让“芝麻开门”成现实[J];电脑爱好者;2013年04期

5 韩小康;声纹[J];知识就是力量;1998年08期

6 窦光宇;利用电脑识别声纹[J];家庭电子;2003年05期

7 陈海东;魏炳生;;浅析计算机声纹技术在安全防范工作中的应用[J];警察技术;2007年06期

8 孙戎;戚越峰;;声纹鉴定中鼻塞语声的研究[J];科教文汇(上旬刊);2012年10期

9 黎粤华,谷志新,刘淑清,王述洋;声纹认证技术[J];水利科技与经济;2005年06期

10 徐文华;陈国华;黄国权;;采用特征与用户名分离方法保护声纹特征[J];微型机与应用;2012年01期

中国重要会议论文全文数据库 前10条

1 陈文翔;杨莹春;;声纹漂移现象初探[A];第九届中国语音学学术会议论文集[C];2010年

2 郑玉玲;张志勇;孟庆华;;光盘声纹鉴定中的一些问题[A];语言与法律研究的新视野——语言与法律首届学术研讨会论文集[C];2002年

3 曹俊兴;;地震声纹分析[A];中国地球物理2010——中国地球物理学会第二十六届年会、中国地震学会第十三次学术大会论文集[C];2010年

4 岳俊发;;动态分析——声纹鉴定的根本方法[A];边缘法学论坛[C];2005年

5 单振宇;杨莹春;吴朝晖;;声纹打卡系统[A];第八届全国人机语音通讯学术会议论文集[C];2005年

6 鲍怀翘;;语音学与声纹鉴定[A];语言与法律研究的新视野——语言与法律首届学术研讨会论文集[C];2002年

7 王英利;;关于声纹鉴定技术的若干问题[A];第九届中国语音学学术会议论文集[C];2010年

8 金阳天;;信号增强处理与电话录音声纹鉴定[A];第六届全国现代语音学学术会议论文集(下)[C];2003年

9 李敬阳;崔效义;王莉;冯祖yN;;三种不同录音器材录制的电话对声纹鉴定的影响[A];新世纪的现代语音学——第五届全国现代语音学学术会议论文集[C];2001年

10 金怡珠;张桂清;刘红伟;崔效义;;AV VCS变声语音声纹变化模式研究[A];第九届中国语音学学术会议论文集[C];2010年

中国重要报纸全文数据库 前10条

1 深圳特区报记者 林清容 实习生 刘春宇;声纹鉴定协助破案数百起[N];深圳特区报;2014年

2 本报记者 李婵;用声音当钥匙声纹锁是否更安全[N];北京科技报;2005年

3 张书涛;声纹鉴定:服务侦查破案[N];检察日报;2002年

4 冯祖yN;声纹鉴定:个体识别的又一利器[N];人民公安报;2003年

5 乔地;声纹鉴定技术锁牢一受贿官员[N];科技日报;2007年

6 南方日报记者 洪奕宜 通讯员 粤公宣;“看得见的声音”破案更犀利[N];南方日报;2011年

7 ;解密声纹锁 一声令下,“芝麻开门”[N];广东科技报;2011年

8 曲豆;声纹鉴定找到敲诈人[N];北京科技报;2004年

9 秦刚邋李厚健;河南洛阳:声纹鉴定锁住受贿证据[N];检察日报;2007年

10 张泽民;中国警方迅速作出反应[N];人民公安报;2004年

中国博士学位论文全文数据库 前2条

1 潘逸倩;声纹密码技术研究[D];中国科学技术大学;2012年

2 朱华虹;声纹特征模板保护方法研究[D];华南理工大学;2014年

中国硕士学位论文全文数据库 前10条

1 孟慧;基于小波变换的声纹参数提取方法与实现[D];沈阳理工大学;2015年

2 柏露;基于性别判定的声纹辨别与确认系统设计与实现[D];电子科技大学;2014年

3 张冬梅;说话人多维声纹特征参数提取平台设计[D];齐齐哈尔大学;2015年

4 张涛涛;语音声纹密码验证技术研究[D];中国科学技术大学;2016年

5 刘大龙;基于感知哈希的音乐声纹检索[D];南京邮电大学;2013年

6 谷志新;基于声纹信息的身份认证模式与算法的研究[D];东北林业大学;2005年

7 章钊;声纹密码识别的关键问题研究[D];中国科学技术大学;2011年

8 周传平;基于熵的音乐声纹检索算法的研究与实现[D];南京邮电大学;2012年

9 李敏丹;非线性动力学方法在声纹分析中的应用[D];浙江大学;2003年

10 陈乐;声纹分析的非线性动力学方法研究[D];浙江大学;2001年



本文编号:726826

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/726826.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户c8580***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com