说话人识别中的背景模型与得分问题研究
本文关键词:说话人识别中的背景模型与得分问题研究,,由笔耕文化传播整理发布。
【摘要】:作为一种生物认证识别技术,说话人识别技术具有远程控制的独特优势,在互联网发展日新月异的今天拥有非常广泛的应用前景。近年来出现的说话人识别主流方法如GMM-SVM, JFA 和 i-vector等都是以GMM-UBM (Gaussian Mixture Model-Universal Background Model,高斯混合-通用背景模型)的识别框架为基础。因此对GMM-UBM的研究仍有很大价值。本文基于GMM-UBM的说话人识别框架,对背景模型建模与得分问题进行了新的探索,并提出了改进系统安全性和性能的方法。本文主要贡献如下:1.对通用背景模型UBM的构建方法进行了新的尝试。我们验证了自包容的UBM的有效性,并在此基础上提出了支撑说话人的概念,即对构建UBM起关键作用的是部分关键说话人。通过PCA降维我们发现,空间分布分散的说话人更有助于组成支撑说话人集合,比随机选择的方式平均识别效果好1%左右;2.针对说话人识别系统的样本复制语音攻击极大限制了说话人识别技术的应用和发展。我们提出了一种基于模型阶数相关的似然得分单调性(Order dependent Likelihood Score Monotonic, OLSM)的样本复制语音检测方法,该方法利用了GMM模型的过拟合现象,可以有效提高GMM-UBM说话人识别系统的安全性。MASC库上该方法对样本复制语音的检测正确率达99.3%。3. GMM token是似然得分最高的高斯分量的索引。作为一种高层次特征,GMM token可以提供很多辅助信息来提高系统性能。传统GMM token中只取得分最高的高斯分量,我们将它扩展为取前N个得分最高的高斯分量,即N-Best token;此外,我们研究了不同GMMtokenizer对改进系统性能上的不同影响。在基于GMM token配比相似度得分校正的说话人识别系统上进行了验证,性能提升效果良好。
【关键词】:说话人识别 GMM-UBM 自包容的UBM 样本复制语音攻击检测 GMM token N-Best token
【学位授予单位】:浙江大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TN912.34
【目录】:
- 摘要4-5
- Abstract5-12
- 第1章 绪论12-18
- 1.1 研究背景与意义12-13
- 1.2 说话人识别任务介绍13-16
- 1.2.1 说话人识别的发展历程13-14
- 1.2.2 说话人识别任务分类14-16
- 1.3 说话人识别中背景模型和得分问题16-17
- 1.4 本文章节安排17-18
- 第2章 基于GMM-UBM的说话人识别方法18-31
- 2.1 概述18
- 2.2 基于GMM-UBM的说话人识别系统框架18-19
- 2.3 前端处理19-24
- 2.3.1 预处理20-21
- 2.3.2 特征提取21-24
- 2.4 GMM模型介绍24-29
- 2.4.1 GMM模型定义24-25
- 2.4.2 GMM模型的参数估计25-28
- 2.4.3 MAP自适应算法得到目标模型28-29
- 2.4.4 GMM-UBM模型似然得分计算29
- 2.5 系统性能评价29-30
- 2.6 本章小结30-31
- 第3章 UBM支撑说话人集合31-45
- 3.1 引言31-32
- 3.2 UBM数据选择方法32-33
- 3.3 自包容的UBM33-35
- 3.4 UBM支撑说话人集合35-40
- 3.4.1 UBM三元组36-38
- 3.4.2 UBM空间三角形38-40
- 3.5 结果验证及分析40-44
- 3.6 本章小结44-45
- 第4章 基于OLSM的样本复制语音入侵检测方法45-58
- 4.1 引言45
- 4.2 说话人识别攻击防御技术研究现状45-46
- 4.3 基于OLSM的样本复制语音攻击检测方法46-52
- 4.3.1 机器学习中的过拟合现象47-48
- 4.3.2 模型阶数相关的似然得分单调性48-51
- 4.3.3 基于OLSM的样本复制语音检测模型51-52
- 4.4 基于OLSM现象样本复制语音检测方法的应用52-56
- 4.4.1 系统流程53-54
- 4.4.2 对样本复制语音回放攻击的检测54
- 4.4.3 对样本复制语音直接攻击的检测54-56
- 4.5 实验及分析56-57
- 4.6 本章小结57-58
- 第5章 N-Best token与GMM_t tokenizer在说话人识别中的应用58-67
- 5.1 GMM token在语音领域的应用58-60
- 5.2 基于GMM token配比向量得分校正的说话人识别系统60-61
- 5.3 N-Best token在说话人识别中的应用61-64
- 5.3.1 N-Best token的定义61-62
- 5.3.2 N-Best token对系统性能的影响62-64
- 5.4 GMM_t tokenizer在说话人识别中的应用64-66
- 5.5 本章小结66-67
- 第6章 总结与展望67-70
- 6.1 工作总结67-68
- 6.2 工作展望68-70
- 参考文献70-74
- 附录A:NIST库UBM训练集降维后空间分布74-76
- 攻读硕士学位期间主要的研究成果76-77
- 致谢77
【相似文献】
中国期刊全文数据库 前10条
1 石艳;王晓晔;;新颖检测法在说话人识别技术中的应用[J];现代计算机(专业版);2008年07期
2 刘雪燕;张娜;袁宝玲;;说话人识别综述[J];电脑知识与技术;2009年01期
3 邱政权;范小春;王俊年;;基于动态环境下的说话人识别[J];科学技术与工程;2010年02期
4 单进;;说话人识别技术研究[J];科技资讯;2010年21期
5 申志生;于明;;说话人识别算法的定点DSP实现[J];单片机与嵌入式系统应用;2011年03期
6 谢建勋;;浅谈说话人识别技术[J];电脑知识与技术;2011年11期
7 安茂波;刘建;;一个快速说话人识别系统的设计和实现[J];网络新媒体技术;2012年03期
8 杨迪;戚银城;刘明军;张华芳子;武军娜;;说话人识别综述[J];电子科技;2012年06期
9 武光利;;说话人识别方法概述[J];硅谷;2012年19期
10 曹业敏,侯风雷,王炳锡;说话人识别技术现状与进展[J];河南科技;1998年09期
中国重要会议论文全文数据库 前10条
1 鲍福良;方志刚;徐洁;;说话人识别综述[A];第六届全国信息获取与处理学术会议论文集(2)[C];2008年
2 孙帆;迟惠生;;循环网络说话人识别[A];第二届全国人机语音通讯学术会议论文集[C];1992年
3 肖剑;欧贵文;;多层前馈神经网络组的文本无关说话人识别[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
4 张玲华;郑宝玉;杨震;;模糊超椭球聚类算法及其在说话人识别中的应用研究[A];第八届全国人机语音通讯学术会议论文集[C];2005年
5 王宏;潘金贵;;基于矩阵正态分布的文本有关说话人识别[A];2007通信理论与技术新发展——第十二届全国青年通信学术会议论文集(上册)[C];2007年
6 戴红霞;赵力;;文本无关说话人识别系统的研究[A];2007’促进西部发展声学学术交流会论文集[C];2007年
7 陈联武;郭武;戴礼荣;;说话人识别系统中多样训练的应用[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
8 崔玉红;胡光锐;;基于神经网络特征维数压缩方法及其在说话人识别中的应用[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年
9 吴丽丽;;基于仿生模式识别的说话人识别学习模型研究[A];第二届中国科学院博士后学术年会暨高新技术前沿与发展学术会议程序册[C];2010年
10 张晶;董金明;冯文全;;说话人识别系统研究与实现[A];全国第二届信号处理与应用学术会议专刊[C];2008年
中国重要报纸全文数据库 前2条
1 汪永安;科大讯飞说话人识别技术世界领先[N];安徽日报;2008年
2 吴长锋;科大讯飞勇夺说话人识别国际大赛第一[N];科技日报;2008年
中国博士学位论文全文数据库 前10条
1 单振宇;情感说话人识别及其解决方法的研究[D];浙江大学;2010年
2 陆伟;基于缺失特征的文本无关说话人识别鲁棒性研究[D];中国科学技术大学;2008年
3 刘镝;说话人识别中信息融合算法的研究[D];北京交通大学;2011年
4 付中华;说话人识别系统鲁棒性研究[D];西北工业大学;2004年
5 林琳;基于模糊聚类与遗传算法的说话人识别理论研究及应用[D];吉林大学;2007年
6 邱政权;在噪声环境下的说话人识别[D];华南理工大学;2007年
7 郭武;复杂信道下的说话人识别[D];中国科学技术大学;2007年
8 钱博;基于汉语元音映射的说话人识别技术研究[D];南京理工大学;2007年
9 姜涛;网络环境下说话人识别关键技术研究[D];哈尔滨工业大学;2011年
10 俞一彪;基于互信息理论的说话人识别研究[D];上海大学;2004年
中国硕士学位论文全文数据库 前10条
1 丛菡菡;基于支持相量机的稳键说话人识别[D];电子科技大学;2008年
2 任舒彬;面向手持应用的说话人识别算法研究[D];浙江大学;2006年
3 申志生;文本相关说话人识别嵌入式系统及其关键技术研究[D];河北工业大学;2011年
4 汪q
本文编号:256285
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/256285.html