当前位置:主页 > 科技论文 > 网络通信论文 >

基于小波和PNCC特征参数的语音识别技术研究

发布时间:2021-05-07 18:22
  随着科学技术的不断发展,人们的需求也越来越高,迫切地希望人与计算机之间的交流实现智能化,也就是机器听懂人类语言,理解人类所发出的命令,实现人机交互,让机器变得更加的智能,更加富有人性,这就促使研究者们加强了对语音识别技术的理解和认识,从而加快了语音识别技术的快速发展。经过60多年研究人员的努力,语音识别技术已经取得了一定的成果,但是更加人性化的完成人类与计算机之间的交流还存在一些技术难题。现如今,语音识别系统在不存在环境干扰时识别率高,鲁棒性强,但是当所处环境复杂时,系统的识别率和鲁棒性就会受到严重影响。因此,实现语音识别系统在噪声干扰情况下仍然具备高识别率和强健抗干扰能力的研究具有着重要的意义。本文介绍了有关语音识别技术的基本原理、关键步骤以及基本流程框架。首先,从整体上对语音识别系统的几个构成部分进行了分析,主要包括语音信息预处理、语音信息特征提取、语音信息模型训练、语音模型参数库以及模式匹配等几个环节。然后,针对语音信息特征提取部分进行了重点研究,对LPCC、MFCC以及PNCC特征参数提取算法的过程以及计算步骤进行了详细的推导与深入的分析。其中,PNCC特征参数提取算法是受到M... 

【文章来源】:重庆大学重庆市 211工程院校 985工程院校 教育部直属院校

【文章页数】:58 页

【学位级别】:硕士

【文章目录】:
中文摘要
英文摘要
1 绪论
    1.1 课题研究的背景与意义
    1.2 语音识别技术研究现状
        1.2.1 特征参数提取领域研究现状
        1.2.2 语音增强领域研究现状
        1.2.3 模型补偿领域研究现状
        1.2.4 语音识别领域研究现状
        1.2.5 难点与不足
    1.3 论文的主要研究内容及组织结构
2 语音识别技术的基本理论
    2.1 语音识别技术基本原理及框架
    2.2 语音信号预处理
        2.2.1 语音信号的预滤波
        2.2.2 语音信号的采样与量化
        2.2.3 语音信号的预加重
        2.2.4 语音信号的加窗分帧
        2.2.5 语音信号的端点检测
    2.3 语音信号的特征参数
        2.3.1 语音信号的特征参数选择标准
        2.3.2 语音信号特征参数的分类
    2.4 语音信号的识别模型
        2.4.1 矢量量化模型
        2.4.2 动态时间规整模型
        2.4.3 隐马尔科夫模型
        2.4.4 人工神经网络模型
    2.5 本章小结
3 语音识别的特征参数提取
    3.1 线性预测倒谱系数LPCC
    3.2 梅尔倒谱系数MFCC
    3.3 能量规整谱系数PNCC
    3.4 基于小波改进的PNCC特征参数提取
        3.4.1 频率变换理论
        3.4.2 基于小波变换的PNCC语音特征改进
        3.4.3 改进的PNCC语音特征提取算法
    3.5 本章小结
4 基于BP神经网络的语音识别
    4.1 BP神经网络
    4.2 基于BP神经网络的语音识别算法
    4.3 实验仿真与分析
        4.3.1 实验准备
        4.3.2 实验内容
        4.3.3 实验结果及分析
    4.4 本章小结
5 总结与展望
    5.1 总结
    5.2 研究展望
致谢
参考文献
附录
    A.作者在攻读学位期间取得的科研成果目录
    B.作者在攻读学位期间参与的科研项目


【参考文献】:
期刊论文
[1]一种基于小波包主成分分析的语音情感识别方法[J]. 朱宗宝,王坤侠,肖玲玲,刘文静.  安徽建筑大学学报. 2017(05)
[2]基于改进PNCC和i-vector的说话人识别鲁棒性[J]. 史小元,景新幸,曾敏,杨海燕.  计算机工程与设计. 2017(04)
[3]一种改进的听觉特征参数应用于说话人识别[J]. 熊冰峰,曾以成,谢小娟.  计算机应用. 2016(S1)
[4]基于改进双门限法的语音端点检测研究[J]. 孙一鸣,吴杨扬,李平.  长春理工大学学报(自然科学版). 2016(01)
[5]基于空间增强和谱减法的语音识别系统[J]. 倪曼蒂,李彪,邹丽萍,张楚才.  湖南师范大学自然科学学报. 2014(03)
[6]关于方言语音信息识别技术在公安工作中的应用研究[J]. 秦飞,韩文奎,谢俊明.  甘肃警察职业学院学报. 2013(03)
[7]基于隐马尔科夫模型的非平稳信源参数估计[J]. 宋奇峰,方勇.  计算机应用与软件. 2013(09)
[8]语音识别技术及应用综述[J]. 禹琳琳.  现代电子技术. 2013(13)
[9]基于DTW的语音识别在MATLAB中的实现方法浅析[J]. 韦春丽,霍春宝.  数字技术与应用. 2011(12)
[10]基于小波包分析的鲁棒性语音识别[J]. 张君昌,李艳艳.  计算机工程与应用. 2011(10)

博士论文
[1]基于信道信息的数字音频盲取证关键问题研究[D]. 王志锋.华南理工大学 2013
[2]基于特征变换和分类的文本无关电话语音说话人识别研究[D]. 解焱陆.中国科学技术大学 2007

硕士论文
[1]融合LPCC和MFCC特征参数的语音识别技术的研究[D]. 张文克.湘潭大学 2016
[2]融合人脸表情和语音的双模态情感识别研究[D]. 谢坷珍.中国海洋大学 2015
[3]基于DTW的孤立词语音识别系统研究[D]. 廖振东.云南大学 2015
[4]基于长时特征的语音端点检测方法研究[D]. 冯璐.湖南大学 2014
[5]基于分数阶小波变换的LFM信号滤波算法研究[D]. 刘启军.哈尔滨工程大学 2014
[6]水下机器人语音识别仿真系统的研究与实现[D]. 姚冰.吉林大学 2012
[7]基于改进MFCC参数的语音识别系统的应用[D]. 余军军.江西理工大学 2012
[8]嵌入式语音识别系统的设计与实现[D]. 斯芸芸.重庆大学 2012
[9]分数阶小波变换及应用研究[D]. 黄雨青.南京航空航天大学 2011
[10]噪声环境下汉语连续语音识别技术研究[D]. 王艳.西北大学 2010



本文编号:3173856

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/wltx/3173856.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户7f925***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com