基于FPGA技术的说话人识别系统的设计
本文关键词:基于FPGA技术的说话人识别系统的设计,由笔耕文化传播整理发布。
【摘要】:说话人识别是通过对说话人所发出的语音进行分析和个性特征参数的提取,自动地判断该说话人是否在所登记的模板库里,以及对该说话人的身份进行验证。目前,说话人识别凭借其与众不同的优势具有较大的市场应用价值和广泛的市场应用前景。FPGA器件可重复编程这一特性有利于日后系统的不断维护和升级,此外,FPGA具有高性能的并行数据处理的功能,能满足市场对系统实时性的要求,所以本文采用FPGA技术来实现说话人识别系统的硬件设计。本文首先对说话人识别的算法进行研究,主要有对采集的语音信号进行预处理、MFCC特征参数提取、VQ模式识别。在传统的算法研究的基础上,本文在端点检测算法中用短时平均幅度代替短时能量,从而更准确地截取了有效音段,同时在对MFCC个性特征参数提取时采用了基于随机共振理论的方法,有效地提高了系统的识别率。说话人识别算法的仿真在Matlab平台上实现,并把Matlab的仿真结果保存在SD卡中,方便与Modelsim仿真结果的对比。建立一个说话人识别系统分为训练阶段和识别阶段,其中识别阶段在DE2开发板上实现,本文采用的芯片是Altera公司的Cyclone II系列芯片EP2C35F672。通过对FPGA芯片结构特点和编程逻辑的了解,针对说话人识别算法,采用自顶向下的模块设计原则,把说话人识别系统分为预加重模块、分帧加窗模块、端点检测模块、MFCC特征参数提取模块、VQ模块和判决模块,其中MFCC特征参数提取模块分为快速傅里叶变换FFT模块、功率谱模块、Mel滤波器组模块、对数运算模块Ln、离散余弦变换模块DCT。设计并实现了各个处理模块,对各个设计模块采用Modelsim仿真工具进行仿真并且对其进行功能验证。设计了程序控制模块NIOS II,结合SOPC的特点,把系统实现的算法和各个接口模块都整合到SOPC系统上,在SOPC Bulider中设置好总线连接关系,配置好内存空间和启动地址,上电后程序导入SDRAM中运行。本文采集了20个人的语音,分别建立了模板训练语音库和说话人测试语音库,从20个模板库里选取5个作为硬件识别系统的参考模板,然后通过Modelsim对该20人的测试语音进行识别仿真,并把仿真结果与Matlab仿真结果进行对比,发现二者虽然有误差但是基本上可以忽略不计,从而验证了该说话人识别系统的功能,实现了说话人识别系统的可行性。对于一个说话人识别系统来说,识别率是非常重要的。本文虽然实现了一套实时可用的基于FPGA技术的说话人识别系统,但是系统的识别率并不是很高,有些问题还需要进一步的研究和探索。比如系统已经提取了比较有效的MFCC特征参数,但在噪音环境下对识别率的影响是很大的,还有就是我们选择特征矢量的时候,选择的方法很多,是否可以通过选择不同的特征参数相结合来提高系统的识别率还有待进一步研究。
【关键词】:说话人识别 FPGA MFCC特征提取 NOISⅡ 识别率
【学位授予单位】:成都理工大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TN791;TN912.34
【目录】:
- 摘要4-6
- Abstract6-10
- 第1章 引言10-16
- 1.1 选题依据和课题研究背景10-11
- 1.2 国内外研究和发展现状11-13
- 1.3 课题研究的目的和意义13-14
- 1.4 主要研究内容及预期成果14-16
- 第2章 说话人识别的算法研究16-27
- 2.1 语音信号预处理17-21
- 2.1.1 预加重17-18
- 2.1.2 分帧加窗18
- 2.1.3 端点检测18-21
- 2.2 MFCC特征参数的提取21-23
- 2.3 码本生成算法23-26
- 2.3.1 矢量量化原理23-24
- 2.3.2 矢量量化的失真测度24-25
- 2.3.3 最佳矢量量化器的设计25-26
- 2.3.4 LBG算法26
- 2.4 本章小结26-27
- 第3章 系统的总体设计27-32
- 3.1 系统的硬件平台27-29
- 3.2 系统电路总体框架29-31
- 3.3 本章小结31-32
- 第4章 系统的硬件和软件设计32-53
- 4.1 系统的硬件设计32-39
- 4.1.1 语音信号采集模块32-34
- 4.1.2 语音数据缓存模块34-35
- 4.1.3 参考数据存储模块35-36
- 4.1.4 LCD液晶显示模块36-37
- 4.1.5 NOIS II控制处理模块37
- 4.1.6 FPGA配置电路37-39
- 4.2 系统的软件设计39-44
- 4.2.1 语音信号预处理40-42
- 4.2.2 MFCC特征参数提取42-43
- 4.2.3 说话人识别系统码本库的建立43-44
- 4.3 系统各功能模块的设计与实现44-52
- 4.3.1 语音预处理模块44-47
- 4.3.2 MFCC特征提取模块47-51
- 4.3.3 VQ模块设计51-52
- 4.3.4 判决模块52
- 4.4 本章小结52-53
- 第5章 系统的仿真测试分析53-57
- 5.1 系统的总体设计53-54
- 5.2 系统识别结果分析54-55
- 5.3 本章小结55-57
- 总结与展望57-59
- 总结57-58
- 展望58-59
- 致谢59-60
- 参考文献60-62
- 攻读学位期间取得学术成果62
【参考文献】
中国期刊全文数据库 前9条
1 何伟;胡又文;张玲;陈方泉;;基于FPGA的说话人识别系统设计与实现[J];重庆大学学报(自然科学版);2007年09期
2 赵贻玖;王厚军;戴志坚;;基于NIOS处理器的数字示波表设计[J];仪器仪表学报;2006年S2期
3 许琦;;基于FPGA的电子密码锁的设计[J];科技信息(学术研究);2006年10期
4 马志欣;王宏;李鑫;;语音识别技术综述[J];昌吉学院学报;2006年03期
5 SAENGHAENGTHAM Nida;KANONGCHAIYOS Pizzanu;;Using LBG quantization for particle-based collision detection algorithm[J];Journal of Zhejiang University Science A(Science in Engineering);2006年07期
6 李连华;;基于FPGA的电子密码锁设计[J];中国科技信息;2006年01期
7 江太辉;基于VQ的说话人识别算法与实验[J];计算机工程与应用;2004年09期
8 邵央,刘丙哲,李宗葛;基于MFCC和加权矢量量化的说话人识别系统[J];计算机工程与应用;2002年05期
9 韩雁,陈利华;说话人计算机识别系统的设计与实现[J];浙江大学学报(工学版);2001年02期
中国博士学位论文全文数据库 前1条
1 陆哲明;矢量量化编码算法及应用研究[D];哈尔滨工业大学;2001年
本文关键词:基于FPGA技术的说话人识别系统的设计,,由笔耕文化传播整理发布。
本文编号:296260
本文链接:https://www.wllwen.com/kejilunwen/dianzigongchenglunwen/296260.html