基于激励源能量和声道谱的元音开始点检测
发布时间:2017-06-01 03:20
本文关键词:基于激励源能量和声道谱的元音开始点检测,由笔耕文化传播整理发布。
【摘要】:语音承载信息繁杂,难以精确分离出各种类型单一信息(如语音内容、说话人特性、情感信息等)。分析和处理语音最关键环节之一是对各类信息的表征或提取。元音是语音中重要的一大类音素,它不仅是能量的主要载体,还蕴含着各种信息的有效特征模式。元音开始点即为元音开始时刻。辅音-元音音节结构中,元音开始点也可认为是辅音-元音分割点,标志着辅音结束和元音开始时刻。不同语音处理应用涉及各种各样的语音事件,元音开始点便是其中重要的语音事件,可作为语音识别、说话人识别、情感识别等重要应用的有效特征。因此,准确检测元音开始点具有重要应用价值。现有元音开始点(VOP)检测方法大致可以分为两类,一类是基于激励源信息实施检测,另一类基于声道信息检测。当前公认检测效果较好的方法是Prasanna S R M提出的基于激励源能量、谱峰能量、调制谱能量和组合能量的元音开始点检测方法。当时间分辨率为?40 ms时,这些检测方法具有很好的检测准确率,但当时间分辨率提高到?30 ms时,其检测准确率急剧下降。针对这个问题,本文提出使用时域包络、稀疏线性预测和最大相位线性预测的元音开始点检测方法,设计处理TIMIT语料库整个TEST部分共336条语句(168个说话人,每个说话人选取两条语句)检测性能评估实验。实验结果表明,当时间分辨率为?30 ms时,采用稀疏线性预测和最大相位线性预测的检测准确率分别为66.64%和64.19%,比基于激励源能量的方法提高3.44%和0.99%。而当时间分辨为?20 ms时,采用稀疏线性预测和最大相位线性预测的检测准确率分别为55.14%和52.81%,比采用激励源能量的方法提高3.94%和1.61%。本文主要创新工作:(1)提出采用频域线性预测算法对时域包络建模的元音开始点检测算法,并给出时域包络建模参数的有效选取方法。(2)提出采用稀疏线性预测算法对激励源能量建模的元音开始点检测算法,以稀疏余项表征激励源能量。(3)提出使用最大相位线性预测算法对激励源能量建模的元音开始点检测算法,通过滤除最大相位信息得到余项来表征激励源能量。
【关键词】:元音开始点 线性预测 频域线性预测 稀疏线性预测 最大相位线性预测
【学位授予单位】:吉林大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TN912.3
【目录】:
- 摘要4-5
- Abstract5-9
- 第1章 绪论9-15
- 1.1 元音开始点检测背景及意义9-10
- 1.2 元音开始点检测研究现状10-11
- 1.3 研究问题及内容11-12
- 1.4 论文结构安排12-15
- 第2章 语音信号处理基本原理15-23
- 2.1 语音生成模型15-16
- 2.2 语音分类16-19
- 2.3 短时处理19-20
- 2.4 语料库简介20-21
- 2.5 本章小结21-23
- 第3章 元音开始点检测特征提取23-37
- 3.1 激励源能量23-28
- 3.1.1 线性预测23-25
- 3.1.2 基于激励源能量元音开始点检测25-28
- 3.2 谱峰能量28-30
- 3.3 调制谱能量30-32
- 3.4 组合能量32-33
- 3.5 实验结果与分析33-35
- 3.6 本章小结35-37
- 第4章 基于时域包络元音开始点检测37-47
- 4.1 频域线性预测37-40
- 4.2 基于时域包络元音开始点检测40-44
- 4.3 实验结果与分析44-45
- 4.4 本章小结45-47
- 第5章 基于激励源能量元音开始点检测47-59
- 5.1 稀疏线性预测47-51
- 5.1.1 余项稀疏的稀疏线性预测48
- 5.1.2 系数稀疏的稀疏线性预测48-49
- 5.1.3 基于稀疏线性预测元音开始点检测49-51
- 5.2 最大相位线性预测51-55
- 5.2.1 最大相位线性预测原理51-53
- 5.2.2 基于最大相位线性预测元音开始点检测53-55
- 5.3 实验结果与分析55-57
- 5.4 本章小结57-59
- 第6章 总结与展望59-61
- 参考文献61-67
- 作者简介67
- 在攻读硕士学位期间发表科研成果67
- 参加项目67-69
- 致谢69
【参考文献】
中国期刊全文数据库 前5条
1 王艳;冯宏伟;张利平;忽满利;;基于元音检测的汉语连续语音声韵母分割[J];计算机工程与应用;2011年14期
2 张利平;冯宏伟;王艳;;基于元音检测的汉语连续语音端点检测方法[J];计算机工程与应用;2010年27期
3 邝航宇,张军,韦岗;一种基于检测元音的孤立词端点检测算法[J];电声技术;2005年03期
4 郭彤颖,吴成东,曲道奎;小波变换理论应用进展[J];信息与控制;2004年01期
5 屈丹,王炳锡;语音信号元音检测的新方法[J];声学学报;2003年01期
中国硕士学位论文全文数据库 前2条
1 虢明;基于FRFT相位谱的说话人识别研究[D];吉林大学;2014年
2 彭远疆;基于线性预测编码的低速率语音编码算法的研究[D];电子科技大学;2005年
本文关键词:基于激励源能量和声道谱的元音开始点检测,由笔耕文化传播整理发布。
,本文编号:411514
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/411514.html