基于Xilinx Zynq的说话人识别的研究与设计

发布时间：2017-06-07 19:16

本文关键词：基于Xilinx Zynq的说话人识别的研究与设计，由笔耕文化传播整理发布。

【摘要】：随着嵌入式系统和说话人识别技术的发展,基于嵌入式的说话人识别系统已经广泛应用在医疗服务、银行证券、公安司法等领域。近年来,随着移动互联网的发展,使用手机、平板电脑等手持设备实现异地身份验证,语音信号可能是表征用户身份的首选特征参数,掀起了一股说话人识别研究的新热潮。本文设计了基于Xilinx Zynq的与文本无关的说话人识别系统,为后续基于移动设备的开发应用奠定基础。本文的主要工作如下:首先,介绍了语音信号的采样量化、预处理和特征参数提取方法。详细阐述了预处理的关键技术:预加重、分帧加窗以及端点检测;详细介绍了特征提取方法MFCC。其次,介绍了高斯混合模型(GMM)的基本原理。具体介绍了运用高斯混合模型进行参数训练的期望最大化(EM)算法,参数训练初始化的k-means算法。阐述了说话人识别系统训练和识别的原理,并使用Matlab进行了仿真实验。再次,本文以Xilinx Zynq为硬件平台,构建了嵌入式与文本无关的说话人识别系统。通过介绍Xilinx Zynq硬件资源,将系统的软件架构分成两部分:PC机辅助软件及嵌入式识别软件,两者通过NFS文件系统进行文件共享。PC机辅助软件主要用于GMM模型参数的训练和识别算法的验证。考虑到FFT计算单元的复杂性,设计了Real FFT硬件加速模块。为包含有Real FFT硬件逻辑的硬件平台搭建了嵌入式环境,这包括添加解析配置文件的u-boot新命令并修改u-boot源码使其支持多系统引导、修改设备树源文件对Flash进行分区、制作根文件系统并将其编译至Linux内核中。然后设计了硬件逻辑的软件接口。最后,对说话人识别系统进行了测试,分析了系统的识别率以及系统响应的实时性,并阐述了对将来工作的展望。
【关键词】：说话人识别 高斯混合模型 MFCC Xilinx Zynq
【学位授予单位】：电子科技大学
【学位级别】：硕士
【学位授予年份】：2015
【分类号】：TN912.34
【目录】：

摘要5-6
英文摘要6-11
第一章绪论11-16
1.1 研究背景11
1.2 国内外研究现状11-14
1.3 论文研究内容14
1.4 论文组织结构14-16
第二章预处理与特征提取16-25
2.1 语音信号的产生16
2.2 语音信号预处理16-19
2.2.1 数字化16-17
2.2.2 预加重17-18
2.2.3 分帧加窗18-19
2.3 端点检测19-22
2.3.1 时域分析20-21
2.3.2 双门限端点检测21-22
2.4 特征参数提取22-24
2.5 小结24-25
第三章高斯混合模型25-35
3.1 GMM的基本原理25-27
3.2 GMM的训练算法27-32
3.2.1 EM算法27-31
3.2.2 EM算法收敛性的证明31
3.2.3 训练数据不充分的问题31-32
3.3 GMM的初始化32-33
3.3.1 高斯分量个数M的确定32
3.3.2 GMM模型参数的初始化32-33
3.4 GMM的识别33-34
3.5 小结34-35
第四章系统总体设计35-46
4.1 软硬件协同设计基本理论35-37
4.1.1 基本概念35
4.1.2 设计流程35-37
4.2 Xilinx Zynq硬件介绍37-43
4.2.1 应用处理单元APU37
4.2.2 片上通用外设37-39
4.2.3 板级设备39-41
4.2.4 可编程逻辑41-42
4.2.5 系统硬件设计42-43
4.3 系统软件设计43-45
4.4 小结45-46
第五章 Real FFT计算单元的硬件映射46-54
5.1 Real FFT计算单元的控制与数据通道46-47
5.2 Real FFT计算单元的设计47-52
5.2.1 FFT IP核48
5.2.2 FFT前端与后端处理48-51
5.2.3 Real FFT总体结构与仿真51-52
5.3 片上系统的构建52-53
5.4 小结53-54
第六章说话人识别系统的软件实现54-80
6.1 PC机辅助软件的实现54-63
6.1.1 语音采集模块54-55
6.1.2 预处理模块55-60
6.1.3 GMM训练模块60-62
6.1.4 识别模块62-63
6.2 嵌入式系统环境63-73
6.2.1 系统搭建63-72
6.2.2 系统的启动72-73
6.3 嵌入式软件实现73-75
6.3.1 识别模块73-74
6.3.2 Real FFT驱动模块74-75
6.4 系统测试和实验结果75-79
6.4.1 PC机辅助软件的功能测试76
6.4.2 嵌入式系统环境的功能测试76-78
6.4.3 系统识别率的测试78
6.4.4 系统响应实时性的测试78-79
6.5 小结79-80
第七章总结与展望80-82
7.1 本文总结80
7.2 展望80-82
致谢82-83
参考文献83-86

【参考文献】

中国硕士学位论文全文数据库前1条

1 邵宝生;基于LonWorks总线技术的说话人识别系统研究与实现[D];东华大学;2007年

本文关键词：基于Xilinx Zynq的说话人识别的研究与设计，由笔耕文化传播整理发布。

，

本文编号：430061

资料下载

论文发表

支付宝下载

Download by Alipay
微信下载

Download by Wechat
会员下载

Download by Member

本文链接：https://www.wllwen.com/kejilunwen/wltx/430061.html

上一篇：异构开放无线网络无缝切换技术研究
下一篇：基于SAR图像的快速大面积滑坡信息提取方法研究

论文发表

·知网|万方|维普|龙源|省级|国家级|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|