当前位置:主页 > 科技论文 > 网络通信论文 >

语音识别算法研究及DSP实现

发布时间:2017-03-30 01:06

  本文关键词:语音识别算法研究及DSP实现,由笔耕文化传播整理发布。


【摘要】:人和人之间用于信息交换的工具有很多种,而其中最直接、最方便的就是语音。语音识别技术(Speech Recognition)是把包含在语音中的有用信息转化成为机器语言。近些年来,在许多高科技领域中,语音识别技术的研究正盛,其实际应用也已遍布于工业控制、移动通信领域以及消费类产品中。正是在这种背景下,本文研究了语音识别的技术和算法,对比分析了目前识别算法中较为主流的动态时间规划(Dynamic Time Warping, DTW)算法和隐马尔科夫模型(Hidden Markov Models,HMM)算法,对传统的DTW算法提出了改进措施来减小算量,给出了所有算法的Matlab仿真,最后设计了以DTW算法为识别算法、以DSP芯片为中央处理单元的小词汇量、孤立词语音识别系统。 论文首先介绍了课题的研究背景和意义,回顾了语音识别技术在国内外的发展历史,并对研究现状和目前的难点及问题作了介绍和分析。在此基础上,展开课题的研究。 其次,论文介绍了语音识别的理论知识,包括基本理论、识别的工作流程,包括语音信号的预处理、端点检测、特征提取、模板训练和识别等环节。其中,在特征参数方面,通过分析比较几种常用的特征参数,最终采用美尔频率倒谱系数(MFCC)作为系统的特征参数;在识别算法方面,研究比较了DTW算法和HMM算法,并对传统DTW算法中运算量较大的缺点提出改进措施。用Matlab7.0对系统所用所有环节的算法实施了仿真,验证了算法的正确性。设计仿真实验,对比了DTW算法和HMM算法的优缺点,综合考虑系统需求和对算法的适应性,选择DTW算法作为系统的识别算法。 硬件方面,构建了以TI公司的TMS320VC5509A DSP为中央处理单元的孤立词语音识别系统,设计出了各个模块的电路,包括音频采集模块、CPLD逻辑控制模块、电源模块、外部存储器模块、JTAG调试模块以及时钟和复位电路等。 软件方面,根据系统需求,设计了系统软件,给出了系统硬件模块初始化流程以及主要的识别算法的流程,并附上了相应的流程图。 最后对系统性能进行测试并得出实验结果。通过分析实验结果可以说明,对于小词汇量、孤立词的语音识别,本系统到达了较好的效果。
【关键词】:语音识别 孤立词 DTW HAMM DSP
【学位授予单位】:安徽理工大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TN912.34
【目录】:
  • 摘要5-6
  • Abstract6-14
  • 1 绪论14-18
  • 1.1 课题的背景及意义14
  • 1.2 语音识别技术国内外发展状况14-15
  • 1.3 语音识别技术存在的问题15-16
  • 1.4 论文的主要内容和组织16-18
  • 2 语音识别的理论知识18-42
  • 2.1 语音信号的预处理18-21
  • 2.1.1 语音信号的采样18-20
  • 2.1.2 语音信号的预加重20
  • 2.1.3 语音信号的加窗和分帧20-21
  • 2.2 语音信号的端点检测21-23
  • 2.2.1 基于短时平均能量21
  • 2.2.2 基于短时平均过零率21-22
  • 2.2.3 双门限比较法22-23
  • 2.3 特征参数提取23-29
  • 2.3.1 线性预测系数(LPC)24-25
  • 2.3.2 LP倒谱系数(LPCC)25-26
  • 2.3.3 Mel频率倒谱系数(MFCC)26-29
  • 2.4 语音识别算法概述29
  • 2.5 动态时间规整(DTW)29-33
  • 2.5.1 模板匹配29-30
  • 2.5.2 DTW算法的原理30-33
  • 2.6 隐马尔科夫模型(HMM)33-38
  • 2.6.1 HMM的定义33
  • 2.6.2 HMM的数学描述33-34
  • 2.6.3 HMM在语音识别中的运用34-35
  • 2.6.4 HMM的三个基本问题35-38
  • 2.7 DTW算法和HMM算法的对比分析38-39
  • 2.8 改进的DTW算法39-41
  • 2.9 本章小结41-42
  • 3 语音识别算法仿真42-62
  • 3.1 语音预处理42-44
  • 3.1.1 预加重42-43
  • 3.1.2 窗函数的选择和分帧43-44
  • 3.2 端点检测算法仿真44-48
  • 3.2.1 短时平均能量44-45
  • 3.2.2 短时平均过零率45-46
  • 3.2.3 双门限法端点检测46-48
  • 3.3 特征参数提取仿真48-50
  • 3.3.1 线性预测系数(LPC)和LP倒谱系数(LPCC)48-49
  • 3.3.2 Mel频率倒谱系数(MFCC)49-50
  • 3.4 DTW算法的仿真实现50-55
  • 3.4.1 传统DTW算法的仿真实现50
  • 3.4.2 改进的DTW算法的仿真实现50-52
  • 3.4.3 DTW算法的模板训练52
  • 3.4.4 DTW算法的匹配仿真52-55
  • 3.5 HMM算法的仿真实现55-59
  • 3.5.0 HMM模型的初始化55
  • 3.5.1 HMM模型的训练55-56
  • 3.5.2 HMM算法的识别56-57
  • 3.5.3 HMM算法的识别仿真实现57-59
  • 3.6 DTW算法和HMM算法的对比59-60
  • 3.7 本章小结60-62
  • 4 语音识别系统硬件结构62-74
  • 4.1 系统硬件总体结构框架62
  • 4.2 TMS320VC5509A芯片简介62-63
  • 4.3 音频采集模块63-66
  • 4.3.1 语音采集芯片TLV320AIC23芯片简介63-65
  • 4.3.2 TLV320AIC23和DSP的接口设计65-66
  • 4.4 电源模块电路设计66-67
  • 4.5 外部存储器模块67-68
  • 4.5.1 FLASH和DSP的接口设计67-68
  • 4.6 CPLD模块68-69
  • 4.7 数据采集与传送模块69-70
  • 4.8 其它模块设计70-72
  • 4.8.1 JTAG调试模块70-71
  • 4.8.2 时钟电路设计71-72
  • 4.8.3 复位电路设计72
  • 4.9 本章小结72-74
  • 5 语音识别系统软件设计及DSP实现74-86
  • 5.1 DSP集成开发环境CCS74-76
  • 5.1.1 CCS概述74
  • 5.1.2 基于CCS3.3的软件开发流程74-76
  • 5.2 DSP软件设计76-84
  • 5.2.1 编程语言选择76
  • 5.2.2 定点DSP的浮点运算76-77
  • 5.2.3 识别部分软件设计77-84
  • 5.3 系统测试及结果分析84-85
  • 5.4 本章小结85-86
  • 6 总结和展望86-88
  • 6.1 全文工作总结86
  • 6.2 不足和展望86-88
  • 参考文献88-92
  • 致谢92-94
  • 作者简介及读研期间主要科研成果94

【参考文献】

中国期刊全文数据库 前10条

1 罗元;黄璜;张毅;胡章芳;;一种新的语音端点检测方法及在智能轮椅人机交互中的应用[J];重庆邮电大学学报(自然科学版);2011年04期

2 张仁志,崔慧娟;基于短时能量的语音端点检测算法研究[J];电声技术;2005年07期

3 吴晓平,崔光照,路康;基于DTW算法的语音识别系统实现[J];电子工程师;2004年07期

4 袁俊;HMM连续语音识别中Viterbi算法的优化及应用[J];电子技术;2001年02期

5 李双勋,欧建平;TLV320AIC23在音频处理中的应用[J];国外电子元器件;2003年10期

6 彭辉;魏玮;陆建华;;特定人孤立词的语音识别系统研究[J];控制工程;2011年03期

7 刘志彪,耿弘;以服务业知识化为主线优化南京投资环境[J];南京社会科学;1999年S1期

8 梁维谦;原道德;丁玉国;;大词表孤立词语音识别的快速搜索算法[J];清华大学学报(自然科学版);2011年01期

9 韩普;姜杰;;HMM在自然语言处理领域中的应用研究[J];计算机技术与发展;2010年02期

10 覃溪;郑建华;曹乃文;钟明辉;黄汉明;;一种语音端点检测的方法及改进[J];微计算机信息;2007年24期


  本文关键词:语音识别算法研究及DSP实现,,由笔耕文化传播整理发布。



本文编号:275844

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/wltx/275844.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户f82c9***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com