说话人识别中区分性问题的研究

发布时间:2020-12-28 03:28
  本文从时域高区分性语音段和特征域高区分性特征两个方面,对说话人识别中的区分性问题进行了深入研究。论文主要工作包括:1.提出说话人识别中区分性问题研究框架。从时域和特征域分别对区分性问题进行研究:从时域,分析不同干扰因素下具有不同区分性的语音段对说话人识别的影响,总结了有利于提高整个说话人识别性能的高区分性语音段的挑选准则;从特征域,研究通过对特征分别进行增强、恢复或者投影等处理手段,提高特征对说话人区分的能力。2.针对环境噪音问题,提出以语音音素概率作为衡量说话人区分性的准则,并以此对高区分性的语音段进行选择。噪音对说话人识别性能的影响很大。本文采用深度学习的方法,学习噪音与语音音素的区分性信息,计算语音段中非噪音段的概率,作为衡量区分性能力的量,以此对不同的特征进行挑选。结果表明,在信噪比为18的环境中,EER可相对降低21.0%。3.对截顶现象进行研究,提出使用非线型模型对被截顶破坏了的特征进行恢复的方法。从单一频率的正弦信号出发,系统地研究了语音截顶现象对说话人识别性能的影响。以区分性衡量为准则,总结了截顶率和区分性信息之间的关系:截顶率越大,区分性信息受损越严重;识别时去掉截顶... 

【文章来源】:清华大学北京市 211工程院校 985工程院校 教育部直属院校

【文章页数】:109 页

【学位级别】:博士

【文章目录】:
摘要
Abstract
第1章 绪论
    1.1 说话人识别应用背景
        1.1.1 说话人识别技术概述
        1.1.2 说话人识别技术应用
    1.2 说话人识别中存在的区分性问题
    1.3 说话人区分性的研究现状
        1.3.1 高区分性段挑选的研究现状
        1.3.2 区分性信息干扰因素
        1.3.3 区分性问题研究难点
    1.4 研究工作概述
        1.4.1 研究思路
        1.4.2 研究框架
        1.4.3 研究内容
    1.5 论文组织结构
第2章 含噪语音高区分性特征的选择
    2.1 引论
    2.2 说话人区分性挑选
        2.2.1 VAD介绍
        2.2.2 VAD存在的不足
        2.2.3 高区分性语音段的筛选
    2.3 基于SPbVAD的说话人区分性信息筛选
        2.3.1 语音中的区分性信息
        2.3.2 SPbVAD
        2.3.3 实验
    2.4 基于贝叶斯方法的特征增强
        2.4.1 基于贝叶斯加权的打分方法
        2.4.2 贝叶斯加权方法的性能
        2.4.3 说话人区分性和语音区分性
    2.5 小结
第3章 截顶语音受损区分性信息的非线性重建
    3.1 引论
        3.1.1 语音截顶的概念
        3.1.2 语音截顶现象的分析
    3.2 截顶语音对说话人区分性的影响
        3.2.1 人类感知评价
        3.2.2 对语音识别的影响
        3.2.3 对说话人识别的影响
        3.2.4 对说话人模型的影响
    3.3 截顶下高区分性语音段的筛选
        3.3.1 截顶检测方法
        3.3.2 截顶筛选下说话人区分性信息的变化
    3.4 截顶语音特征信息的恢复
        3.4.1 DNN介绍
        3.4.2 基于DNN的截顶语音特征重建
        3.4.3 特征区分性恢复
    3.5 小结
第4章 情感区分性信息的削弱
    4.1 引言
    4.2 情感说话人数据库CSLT-ESDB
        4.2.1 现有的情感数据库
        4.2.2 情感数据库的设计与录制
    4.3 情感特征空间投影
        4.3.1 情感对语音信号的影响
        4.3.2 情感的区分性信息
        4.3.3 实验
    4.4 特征和模型对情感投影的联合优化
        4.4.1 情感适应性训练
        4.4.2 实验
    4.5 小结
第5章 总结和展望
    5.1 论文工作总结
    5.2 下一步研究展望
参考文献
致谢
个人简历、在学期间发表的学术论文与研究成果


【参考文献】:
期刊论文
[1]说话人识别技术在社保系统中的远程身份认证应用研究[J]. 黄奋,马皓,邓菁.  电子技术与软件工程. 2014(02)
[2]GMM-UBM和SVM说话人辨认系统及融合的分析[J]. 鲍焕军,郑方.  清华大学学报(自然科学版). 2008(S1)



本文编号:2943045

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/xxkjbs/2943045.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户ae419***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com