具有环境噪声感知功能的说话人确认系统的研究

发布时间:2020-10-15 08:57
   近年来,声纹特征作为个人信息验证领域的研究热点发展迅速。目前,说话人确认系统在实验室环境中已可以达到相当高的识别准确率,但在现实情况中,由于噪声的干扰,系统的性能将受到严重影响,这大大妨碍了说话人确认技术在实际环境中的应用。本文提出了一种具有环境噪声感知功能的说话人确认系统。该系统采用具有抗噪性能的清浊音判决法提取出有效的语音段用于说话人特征的提取,采用特定环境噪声融合到背景模型中用于说话人模型的训练和调整,采用噪声识别算法判别出环境噪声类型用于说话人模型的选择。具体而言,在系统的训练阶段,首先为多种噪音建立其特定的背景模型,然后根据最大后验概率对说话人模型进行调整,从而最大限度地模拟噪声环境下说话人模型的状态,减少训练模型与测试环境之间的差异;在系统的测试阶段,首先对测试语音的环境噪声进行估计与识别,然后根据噪声的识别结果选择最相似的背景模型进行测试评分,以模型补偿的方式提高系统鲁棒性。此外,带噪的语音信号在进入说话人确认系统进行测试之前,首先根据其特征参数的特点,采用基于梅尔域的二次滤波的方法进行前端降噪,然后仅保留语音信号的浊音段作为特征参数提取的基础,从而进一步减少噪声对系统的影响。论文的仿真实验分别基于英文和中文语音库,选用多种不同噪音类型,在5dB的噪音环境下,比起传统算法,利用该技术可将等错误率最高减少26.38%,平均可减少16.44%,表明该系统在噪声环境下的说话人确认方面具有显著的优越性。
【学位单位】:上海交通大学
【学位级别】:硕士
【学位年份】:2015
【中图分类】:TN912.3
【文章目录】:
摘要
ABSTRACT
第1章 绪论
    1.1 论文研究背景
    1.2 说话人识别基本结构
    1.3 噪声环境下说话人确认的研究现状
    1.4 论文研究内容及意义
    1.5 论文组织结构
第2章 基于GMM-UBM的说话人确认
    2.1 特征参数的提取
        2.1.1 帧的概念
        2.1.2 Mel倒谱系数
        2.1.3 环境补偿
        2.1.4 高阶MFCC
    2.2 建立说话人模型
        2.2.1 混合高斯模型
        2.2.2 联合背景模型的混合高斯模型
        2.2.3 其它建模方式
    2.3 得分规整
        2.3.1 Z-Norm规整
        2.3.2 T-Norm规整
        2.3.3 ZT-Norm规整
        2.3.4 TZ-Norm规整
    2.4 实验语音库及工具包介绍
        2.4.1 干净语音库与噪声库
        2.4.2 系统评估方法
        2.4.3 Voicebox工具包
        2.4.4 ALIZE测试平台
    2.5 本章小结
第3章 环境噪声的感知与识别
    3.1 环境噪声的估计算法
        3.1.1 噪声估计原理
        3.1.2 算法思想
        3.1.3 算法的仿真结果
    3.2 噪声类型识别
        3.2.1 噪声的特征向量提取
        3.2.2 噪声建模
        3.2.3 组合对比实验
        3.2.4 实验小结
    3.3 本章小结
第4章 噪声环境下特征提取的预处理方法
    4.1 降噪预处理
        4.1.1 OM-LSA
        4.1.2 DSR-NR
        4.1.3 对比实验及结果分析
    4.2 端点检测
        4.2.1 VAD
        4.2.2 清浊音判断
        4.2.3 对比实验及结果分析
    4.3 预处理方法改进前后的实验对比
    4.4 本章小结
第5章 具有环境噪声感知功能的说话人确认系统
    5.1 总体设计
        5.1.1 现有的说话人确认系统
        5.1.2 本文提出的说话人确认系统
        5.1.3 两种系统的比较分析
    5.2 训练阶段
    5.3 测试阶段
    5.4 仿真评估与实验结果
        5.4.1 实验环境设置
        5.4.2 仿真实验结果及分析
        5.4.3 算法还待改进空间
    5.5 本章小结
第6章 结束语
    6.1 主要工作与创新点
    6.2 后续研究工作
参考文献
致谢
攻读硕士学位期间已发表或录用的论文

【相似文献】

相关期刊论文 前10条

1 郭伟;李辉;许敏强;刘青松;;基于高维空间映射失配补偿方法的说话人确认[J];中国科学技术大学学报;2010年02期

2 张怡颖,朱小燕,张钹;一种新的说话人确认方法[J];软件学报;1999年04期

3 翁武斌,方棣棠;应用分段辨认序列频度信息的说话人确认方法[J];中文信息学报;2000年05期

4 文学,刘加,刘润生;一种改进的新型说话人确认算法[J];清华大学学报(自然科学版);2003年01期

5 陈继旭;刘明辉;戴蓓蒨;李辉;;文本无关说话人确认中的一种新的评分规整方法[J];信号处理;2006年04期

6 刘明辉;戴蓓蒨;解焱陆;;基于GMM多维概率输出的SVM话者确认[J];模式识别与人工智能;2008年01期

7 解焱陆;刘青松;戴蓓蒨;李辉;;一种用于鲁棒性说话人确认的分段概率分布参数规整方法[J];电路与系统学报;2008年06期

8 郭武;李轶杰;戴礼荣;王仁华;;采用非监督得分规整和因子分析的说话人确认[J];电子学报;2009年04期

9 许东星;戴蓓蒨;许敏强;刘青松;;声母发声特点参数的提取及其提高说话人确认鲁棒性的研究[J];信号处理;2009年09期

10 陈存宝;赵力;;嵌入时延网络的高斯混合背景模型说话人确认[J];信号处理;2010年04期


相关博士学位论文 前3条

1 刘明辉;基于GMM和SVM的文本无关的说话人确认方法研究[D];中国科学技术大学;2007年

2 高二中;对话电话语音的话者确认研究[D];中国科学技术大学;2011年

3 龙艳花;基于SVM的话者确认关键技术研究[D];中国科学技术大学;2011年


相关硕士学位论文 前10条

1 赵启明;一种新的说话人确认方法研究[D];浙江大学;2015年

2 曾祺;文本无关的多说话人确认研究[D];电子科技大学;2014年

3 王一蕾;抗录音回放的说话人身份确认系统的设计与实现[D];电子科技大学;2014年

4 曹一鸣;具有环境噪声感知功能的说话人确认系统的研究[D];上海交通大学;2015年

5 郭伟;基于信道补偿方法的说话人确认研究[D];中国科学技术大学;2009年

6 周元;文本无关的说话人确认系统的研究[D];重庆大学;2006年

7 周毓;基于因子分析的说话人确认[D];中国科学技术大学;2010年

8 卓著;基于信道补偿技术的说话人确认研究[D];中国科学技术大学;2015年

9 陈晓阳;远程语音通话实时说话人确认系统研究与实现[D];厦门大学;2009年

10 刘梓铭;复杂背景下说话人确认的研究[D];北京交通大学;2015年



本文编号:2841962

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/2841962.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户18642***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com