基于Xilinx Zynq的说话人识别的研究与设计
发布时间:2017-06-07 19:16
本文关键词:基于Xilinx Zynq的说话人识别的研究与设计,由笔耕文化传播整理发布。
【摘要】:随着嵌入式系统和说话人识别技术的发展,基于嵌入式的说话人识别系统已经广泛应用在医疗服务、银行证券、公安司法等领域。近年来,随着移动互联网的发展,使用手机、平板电脑等手持设备实现异地身份验证,语音信号可能是表征用户身份的首选特征参数,掀起了一股说话人识别研究的新热潮。本文设计了基于Xilinx Zynq的与文本无关的说话人识别系统,为后续基于移动设备的开发应用奠定基础。本文的主要工作如下:首先,介绍了语音信号的采样量化、预处理和特征参数提取方法。详细阐述了预处理的关键技术:预加重、分帧加窗以及端点检测;详细介绍了特征提取方法MFCC。其次,介绍了高斯混合模型(GMM)的基本原理。具体介绍了运用高斯混合模型进行参数训练的期望最大化(EM)算法,参数训练初始化的k-means算法。阐述了说话人识别系统训练和识别的原理,并使用Matlab进行了仿真实验。再次,本文以Xilinx Zynq为硬件平台,构建了嵌入式与文本无关的说话人识别系统。通过介绍Xilinx Zynq硬件资源,将系统的软件架构分成两部分:PC机辅助软件及嵌入式识别软件,两者通过NFS文件系统进行文件共享。PC机辅助软件主要用于GMM模型参数的训练和识别算法的验证。考虑到FFT计算单元的复杂性,设计了Real FFT硬件加速模块。为包含有Real FFT硬件逻辑的硬件平台搭建了嵌入式环境,这包括添加解析配置文件的u-boot新命令并修改u-boot源码使其支持多系统引导、修改设备树源文件对Flash进行分区、制作根文件系统并将其编译至Linux内核中。然后设计了硬件逻辑的软件接口。最后,对说话人识别系统进行了测试,分析了系统的识别率以及系统响应的实时性,并阐述了对将来工作的展望。
【关键词】:说话人识别 高斯混合模型 MFCC Xilinx Zynq
【学位授予单位】:电子科技大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TN912.34
【目录】:
- 摘要5-6
- 英文摘要6-11
- 第一章 绪论11-16
- 1.1 研究背景11
- 1.2 国内外研究现状11-14
- 1.3 论文研究内容14
- 1.4 论文组织结构14-16
- 第二章 预处理与特征提取16-25
- 2.1 语音信号的产生16
- 2.2 语音信号预处理16-19
- 2.2.1 数字化16-17
- 2.2.2 预加重17-18
- 2.2.3 分帧加窗18-19
- 2.3 端点检测19-22
- 2.3.1 时域分析20-21
- 2.3.2 双门限端点检测21-22
- 2.4 特征参数提取22-24
- 2.5 小结24-25
- 第三章 高斯混合模型25-35
- 3.1 GMM的基本原理25-27
- 3.2 GMM的训练算法27-32
- 3.2.1 EM算法27-31
- 3.2.2 EM算法收敛性的证明31
- 3.2.3 训练数据不充分的问题31-32
- 3.3 GMM的初始化32-33
- 3.3.1 高斯分量个数M的确定32
- 3.3.2 GMM模型参数的初始化32-33
- 3.4 GMM的识别33-34
- 3.5 小结34-35
- 第四章 系统总体设计35-46
- 4.1 软硬件协同设计基本理论35-37
- 4.1.1 基本概念35
- 4.1.2 设计流程35-37
- 4.2 Xilinx Zynq硬件介绍37-43
- 4.2.1 应用处理单元APU37
- 4.2.2 片上通用外设37-39
- 4.2.3 板级设备39-41
- 4.2.4 可编程逻辑41-42
- 4.2.5 系统硬件设计42-43
- 4.3 系统软件设计43-45
- 4.4 小结45-46
- 第五章 Real FFT计算单元的硬件映射46-54
- 5.1 Real FFT计算单元的控制与数据通道46-47
- 5.2 Real FFT计算单元的设计47-52
- 5.2.1 FFT IP核48
- 5.2.2 FFT前端与后端处理48-51
- 5.2.3 Real FFT总体结构与仿真51-52
- 5.3 片上系统的构建52-53
- 5.4 小结53-54
- 第六章 说话人识别系统的软件实现54-80
- 6.1 PC机辅助软件的实现54-63
- 6.1.1 语音采集模块54-55
- 6.1.2 预处理模块55-60
- 6.1.3 GMM训练模块60-62
- 6.1.4 识别模块62-63
- 6.2 嵌入式系统环境63-73
- 6.2.1 系统搭建63-72
- 6.2.2 系统的启动72-73
- 6.3 嵌入式软件实现73-75
- 6.3.1 识别模块73-74
- 6.3.2 Real FFT驱动模块74-75
- 6.4 系统测试和实验结果75-79
- 6.4.1 PC机辅助软件的功能测试76
- 6.4.2 嵌入式系统环境的功能测试76-78
- 6.4.3 系统识别率的测试78
- 6.4.4 系统响应实时性的测试78-79
- 6.5 小结79-80
- 第七章 总结与展望80-82
- 7.1 本文总结80
- 7.2 展望80-82
- 致谢82-83
- 参考文献83-86
【参考文献】
中国硕士学位论文全文数据库 前1条
1 邵宝生;基于LonWorks总线技术的说话人识别系统研究与实现[D];东华大学;2007年
本文关键词:基于Xilinx Zynq的说话人识别的研究与设计,由笔耕文化传播整理发布。
,本文编号:430061
本文链接:https://www.wllwen.com/kejilunwen/wltx/430061.html