当前位置:主页 > 科技论文 > 信息工程论文 >

话者确认中信道和时长失配补偿研究

发布时间:2017-06-08 23:01

  本文关键词:话者确认中信道和时长失配补偿研究,,由笔耕文化传播整理发布。


【摘要】:文本无关的说话人确认技术旨在从语音中提取说话人的个性信息从而完成说话人身份的验证。使用便捷以及非接触式交互等独特的优势使其得到越来越广泛的应用,并成为当今生物特征识别领域的研究热点。近年来,说话人确认技术逐渐走向实用,但由于实际环境的复杂性,面临着传输信道的多样化、背景噪声污染等问题,说话人确认技术性能难以提升。本论文主要是研究环境失配下的说话人确认,从失配补偿的角度出发,探讨了全局差异空间方法以及概率线性鉴别分析方法,并对其存在的问题提出改进方案。本论文主要的研究工作有:首先,探讨了美尔频率倒谱参数的提取过程,介绍了高斯混合模型(Gaussian Mixture Model, GMM),对其原理以及训练算法进行详细的阐述,并深入分析了GMM用于说话人确认的优缺点,构建了基于GMM-UBM框架的说话人确认系统,并通过实验分析GMM-UBM系统的性能。接着,深入研究说话人确认失配补偿方法。利用因子分析的方法,从高斯均值超矢量提取出具有区分性的身份矢量I-Vector,构建了基于I-Vector的说话人确认系统。给出线性鉴别分析、类内协方差规整等信道补偿方法对I-Vector系统进行改进,实验结果表明这些方法可以有效地改善信道失配对说话人确认系统的负面影响。最后,深入研究概率线性鉴别分析(Probabilistic Linear Discriminant Analysis, PLDA)方法对说话人以及干扰信息的建模能力,简化高斯概率线性鉴别分析(Gaussian PLDA, GPLDA)以及其得分公式,构建基于高斯概率线性鉴别分析的说话人确认系统,研究其对I-Vector矢量的补偿能力。此外,针对训练语音与测试语音时长失配的情况,提出估计时长差异信息的方法,并将此时长差异信息融入PLDA系统,实验表明,该方法在一定程度上提高系统的性能。
【关键词】:说话人确认 高斯混合模型 I-Vector矢量 概率线性鉴别分析 失配
【学位授予单位】:中国科学技术大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TN912.34
【目录】:
  • 摘要5-6
  • ABSTRACT6-11
  • 第一章 绪论11-21
  • 1.1 引言11
  • 1.2 研究背景以及意义11-12
  • 1.3 说话人识别发展概况12-13
  • 1.4 说话人识别的分类13
  • 1.5 说话人确认13-18
  • 1.5.1 前端处理14-15
  • 1.5.2 模型匹配15
  • 1.5.3 评分决策15-16
  • 1.5.4 说话人确认系统的性能评价指标16-18
  • 1.5.4.1 等误识率与DET曲线17
  • 1.5.4.2 检测代价函数17-18
  • 1.6 影响说话人确认系统性能的因素18-20
  • 1.7 本文主要研究工作20-21
  • 第二章 基于GMM-UBM的说话人确认系统21-33
  • 2.1 引言21-22
  • 2.2 前端处理22-24
  • 2.2.1 特征提取22
  • 2.2.2 美尔频率倒谱参数22-24
  • 2.3 高斯混合模型24-28
  • 2.3.1 高斯混合模型的概念24-26
  • 2.3.2 模型参数估计26-28
  • 2.4 基于GMM-UBM的说话人确认28-31
  • 2.4.1 GMM-UBM系统框架28-29
  • 2.4.2 MAP自适应算法29-31
  • 2.5 实验结果与分析31-32
  • 2.5.1 实验参数说明31-32
  • 2.5.2 混合度对GMM-UBM系统影响32
  • 2.6 本章小结32-33
  • 第三章 基于I-Vector的说话人确认研究33-49
  • 3.1 引言33-34
  • 3.2 均值超矢量34
  • 3.3 因子分析的概念34-35
  • 3.4 联合因子分析35-37
  • 3.5 I-Vector矢量37-40
  • 3.5.1 全局差异空间矩阵估计38-39
  • 3.5.2 I-Vector提取39
  • 3.5.3 余弦评分39-40
  • 3.6 信道补偿技术40-43
  • 3.6.1 线性鉴别分析41-42
  • 3.6.2 类内协方差规整42-43
  • 3.7 实验结果与分析43-47
  • 3.7.1 训练数据以及参数配置43-44
  • 3.7.2 I-Vector维度对系统的影响44
  • 3.7.3 信道补偿系统的性能分析44-45
  • 3.7.4 时长对I-Vector系统的影响45-47
  • 3.8 本章小结47-49
  • 第四章 基于PLDA的说话人确认研究49-65
  • 4.1 引言49-50
  • 4.2 PLDA模型50-57
  • 4.2.1 简化GPLDA模型51-52
  • 4.2.2 GPLDA模型训练52-55
  • 4.2.3 GPLDA得分计算55-57
  • 4.3 I-Vector矢量后处理57-59
  • 4.4 改进GPLDA模型59-61
  • 4.4.1 时长对GPLDA系统的影响分析59
  • 4.4.2 融入时长差异信息的GPLDA59-60
  • 4.4.3 时长差异信息的估计60-61
  • 4.5 实验结果与分析61-64
  • 4.5.1 训练数据以及参数配置61
  • 4.5.2 GPLDA系统的性能分析61-62
  • 4.5.3 改进GPLDA模型的性能分析62-64
  • 4.6 本章小结64-65
  • 第五章 总结与展望65-67
  • 参考文献67-71
  • 致谢71-73
  • 在读期间发表的学术论文与取得的研究成果73

【参考文献】

中国博士学位论文全文数据库 前1条

1 刘青松;话者识别中失配信息补偿理论和方法研究[D];中国科学技术大学;2011年


  本文关键词:话者确认中信道和时长失配补偿研究,由笔耕文化传播整理发布。



本文编号:433883

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/433883.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户921d1***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com