语音识别算法研究及DSP实现

发布时间：2017-03-30 01:06

本文关键词：语音识别算法研究及DSP实现，由笔耕文化传播整理发布。

【摘要】：人和人之间用于信息交换的工具有很多种,而其中最直接、最方便的就是语音。语音识别技术(Speech Recognition)是把包含在语音中的有用信息转化成为机器语言。近些年来,在许多高科技领域中,语音识别技术的研究正盛,其实际应用也已遍布于工业控制、移动通信领域以及消费类产品中。正是在这种背景下,本文研究了语音识别的技术和算法,对比分析了目前识别算法中较为主流的动态时间规划(Dynamic Time Warping, DTW)算法和隐马尔科夫模型(Hidden Markov Models,HMM)算法,对传统的DTW算法提出了改进措施来减小算量,给出了所有算法的Matlab仿真,最后设计了以DTW算法为识别算法、以DSP芯片为中央处理单元的小词汇量、孤立词语音识别系统。论文首先介绍了课题的研究背景和意义,回顾了语音识别技术在国内外的发展历史,并对研究现状和目前的难点及问题作了介绍和分析。在此基础上,展开课题的研究。其次,论文介绍了语音识别的理论知识,包括基本理论、识别的工作流程,包括语音信号的预处理、端点检测、特征提取、模板训练和识别等环节。其中,在特征参数方面,通过分析比较几种常用的特征参数,最终采用美尔频率倒谱系数(MFCC)作为系统的特征参数；在识别算法方面,研究比较了DTW算法和HMM算法,并对传统DTW算法中运算量较大的缺点提出改进措施。用Matlab7.0对系统所用所有环节的算法实施了仿真,验证了算法的正确性。设计仿真实验,对比了DTW算法和HMM算法的优缺点,综合考虑系统需求和对算法的适应性,选择DTW算法作为系统的识别算法。硬件方面,构建了以TI公司的TMS320VC5509A DSP为中央处理单元的孤立词语音识别系统,设计出了各个模块的电路,包括音频采集模块、CPLD逻辑控制模块、电源模块、外部存储器模块、JTAG调试模块以及时钟和复位电路等。软件方面,根据系统需求,设计了系统软件,给出了系统硬件模块初始化流程以及主要的识别算法的流程,并附上了相应的流程图。最后对系统性能进行测试并得出实验结果。通过分析实验结果可以说明,对于小词汇量、孤立词的语音识别,本系统到达了较好的效果。
【关键词】：语音识别 孤立词 DTW HAMM DSP
【学位授予单位】：安徽理工大学
【学位级别】：硕士
【学位授予年份】：2015
【分类号】：TN912.34
【目录】：

摘要5-6
Abstract6-14
1 绪论14-18
1.1 课题的背景及意义14
1.2 语音识别技术国内外发展状况14-15
1.3 语音识别技术存在的问题15-16
1.4 论文的主要内容和组织16-18
2 语音识别的理论知识18-42
2.1 语音信号的预处理18-21
2.1.1 语音信号的采样18-20
2.1.2 语音信号的预加重20
2.1.3 语音信号的加窗和分帧20-21
2.2 语音信号的端点检测21-23
2.2.1 基于短时平均能量21
2.2.2 基于短时平均过零率21-22
2.2.3 双门限比较法22-23
2.3 特征参数提取23-29
2.3.1 线性预测系数(LPC)24-25
2.3.2 LP倒谱系数(LPCC)25-26
2.3.3 Mel频率倒谱系数(MFCC)26-29
2.4 语音识别算法概述29
2.5 动态时间规整(DTW)29-33
2.5.1 模板匹配29-30
2.5.2 DTW算法的原理30-33
2.6 隐马尔科夫模型(HMM)33-38
2.6.1 HMM的定义33
2.6.2 HMM的数学描述33-34
2.6.3 HMM在语音识别中的运用34-35
2.6.4 HMM的三个基本问题35-38
2.7 DTW算法和HMM算法的对比分析38-39
2.8 改进的DTW算法39-41
2.9 本章小结41-42
3 语音识别算法仿真42-62
3.1 语音预处理42-44
3.1.1 预加重42-43
3.1.2 窗函数的选择和分帧43-44
3.2 端点检测算法仿真44-48
3.2.1 短时平均能量44-45
3.2.2 短时平均过零率45-46
3.2.3 双门限法端点检测46-48
3.3 特征参数提取仿真48-50
3.3.1 线性预测系数(LPC)和LP倒谱系数(LPCC)48-49
3.3.2 Mel频率倒谱系数(MFCC)49-50
3.4 DTW算法的仿真实现50-55
3.4.1 传统DTW算法的仿真实现50
3.4.2 改进的DTW算法的仿真实现50-52
3.4.3 DTW算法的模板训练52
3.4.4 DTW算法的匹配仿真52-55
3.5 HMM算法的仿真实现55-59
3.5.0 HMM模型的初始化55
3.5.1 HMM模型的训练55-56
3.5.2 HMM算法的识别56-57
3.5.3 HMM算法的识别仿真实现57-59
3.6 DTW算法和HMM算法的对比59-60
3.7 本章小结60-62
4 语音识别系统硬件结构62-74
4.1 系统硬件总体结构框架62
4.2 TMS320VC5509A芯片简介62-63
4.3 音频采集模块63-66
4.3.1 语音采集芯片TLV320AIC23芯片简介63-65
4.3.2 TLV320AIC23和DSP的接口设计65-66
4.4 电源模块电路设计66-67
4.5 外部存储器模块67-68
4.5.1 FLASH和DSP的接口设计67-68
4.6 CPLD模块68-69
4.7 数据采集与传送模块69-70
4.8 其它模块设计70-72
4.8.1 JTAG调试模块70-71
4.8.2 时钟电路设计71-72
4.8.3 复位电路设计72
4.9 本章小结72-74
5 语音识别系统软件设计及DSP实现74-86
5.1 DSP集成开发环境CCS74-76
5.1.1 CCS概述74
5.1.2 基于CCS3.3的软件开发流程74-76
5.2 DSP软件设计76-84
5.2.1 编程语言选择76
5.2.2 定点DSP的浮点运算76-77
5.2.3 识别部分软件设计77-84
5.3 系统测试及结果分析84-85
5.4 本章小结85-86
6 总结和展望86-88
6.1 全文工作总结86
6.2 不足和展望86-88
参考文献88-92
致谢92-94
作者简介及读研期间主要科研成果94

【参考文献】

中国期刊全文数据库前10条

1 罗元;黄璜;张毅;胡章芳;;一种新的语音端点检测方法及在智能轮椅人机交互中的应用[J];重庆邮电大学学报(自然科学版);2011年04期

2 张仁志,崔慧娟;基于短时能量的语音端点检测算法研究[J];电声技术;2005年07期

3 吴晓平,崔光照,路康;基于DTW算法的语音识别系统实现[J];电子工程师;2004年07期

4 袁俊;HMM连续语音识别中Viterbi算法的优化及应用[J];电子技术;2001年02期

5 李双勋,欧建平;TLV320AIC23在音频处理中的应用[J];国外电子元器件;2003年10期

6 彭辉;魏玮;陆建华;;特定人孤立词的语音识别系统研究[J];控制工程;2011年03期

7 刘志彪,耿弘;以服务业知识化为主线优化南京投资环境[J];南京社会科学;1999年S1期

8 梁维谦;原道德;丁玉国;;大词表孤立词语音识别的快速搜索算法[J];清华大学学报(自然科学版);2011年01期

9 韩普;姜杰;;HMM在自然语言处理领域中的应用研究[J];计算机技术与发展;2010年02期

10 覃溪;郑建华;曹乃文;钟明辉;黄汉明;;一种语音端点检测的方法及改进[J];微计算机信息;2007年24期

本文关键词：语音识别算法研究及DSP实现，，由笔耕文化传播整理发布。

本文编号：275844

资料下载

论文发表

支付宝下载

Download by Alipay
微信下载

Download by Wechat
会员下载

Download by Member

本文链接：https://www.wllwen.com/kejilunwen/wltx/275844.html

上一篇：加油站视频监控方案及实现
下一篇：无线自组网中AODV路由性能的分析与改进

论文发表

·知网|万方|维普|龙源|省级|国家级|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|