当前位置:主页 > 科技论文 > 信息工程论文 >

基于ARM的说话人识别系统的设计与实现

发布时间:2017-08-22 00:19

  本文关键词:基于ARM的说话人识别系统的设计与实现


  更多相关文章: 说话人识别系统 ARM 端点检测 特征提取 Linux


【摘要】:目前的说话人识别系统普遍采用PC机或者服务器的形式作为系统的工作平台,这种方式不可避免地存在体积大、功耗高、不便携和实用性低等问题,使得说话人识别系统至今无法普及。针对这样的问题,本文设计并实现了一种基于ARM的便携式说话人识别系统。本文对说话人识别系统的基本算法进行了深入的研究分析与改进,提出了基于时频参数融合的自适应端点检测算法,提高了端点检测的准确率和抗噪性,解决了常用端点检测算法在噪声环境中不能有效地分割词语的问题;还提出了基于Fisher比的Bark小波包变换的特征提取算法,明显提高了系统的识别率和鲁棒性,解决了MFCC特征参数在噪声环境中识别率低的问题。本文采用OK6410开发板作为硬件平台,并移植Linux操作系统作为软件平台,在此基础上设计软件框架。首先移植本文研究的说话人识别算法,实现算法各部分功能;其次在硬件平台上实现语音信号的采集,采集的语音数据经过特征提取算法获得Fisher比Bark小波包倒谱系数(FWBCC),使用VQ建立模型,采用欧式距离计算出识别测试模板与模板库中所有模板的误差,找出误差最小的模板作为识别结果;最后在QT用户界面上显示和播报识别结果,并将整个系统移植到硬件平台上进行测试。测试表明,系统达到了预期的设计目标,具有较好的便携性、准确性和鲁棒性,为实际生活中的密码支付提供了一种新的方案。
【关键词】:说话人识别系统 ARM 端点检测 特征提取 Linux
【学位授予单位】:西安工程大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TN912.34
【目录】:
  • 摘要3-4
  • Abstract4-7
  • 1 绪论7-11
  • 1.1 选题背景7
  • 1.2 国内外发展现状7-8
  • 1.3 说话人识别系统概述8-9
  • 1.3.1 说话人识别系统的原理8
  • 1.3.2 说话人识别系统的分类8-9
  • 1.4 课题研究内容9
  • 1.5 论文组织结构与安排9-11
  • 2 说话人识别系统的基本算法及其改进11-35
  • 2.1 说话人识别系统的基本算法11-20
  • 2.1.1 预处理11-13
  • 2.1.2 端点检测13-15
  • 2.1.3 特征提取15-17
  • 2.1.4 模式匹配17-20
  • 2.2 基于时频参数融合的自适应端点检测算法20-26
  • 2.2.1 算法改进思路20
  • 2.2.2 算法实现流程20-24
  • 2.2.3 算法验证与分析24-26
  • 2.3 基于Fisher比的Bark小波包变换的特征提取算法26-35
  • 2.3.1 算法改进思路26-27
  • 2.3.2 算法实现流程27-31
  • 2.3.3 算法验证与分析31-35
  • 3 说话人识别系统的平台设计35-55
  • 3.1 系统硬件平台设计35-40
  • 3.1.1 说话人识别系统硬件设计35-36
  • 3.1.2 嵌入式处理器的选择36
  • 3.1.3 开发板简介36-37
  • 3.1.4 音频接口设计37-40
  • 3.2 系统开发流程40-41
  • 3.2.1 交叉开发模式40
  • 3.2.2 嵌入式Linux系统开发流程40-41
  • 3.3 主机开发环境搭建41-45
  • 3.3.1 制作安装交叉编译工具链41-44
  • 3.3.2 安装配置NFS服务44-45
  • 3.4 目标机开发环境搭建45-55
  • 3.4.1 系统引导程序的移植45-47
  • 3.4.2 嵌入式Linux内核的移植47-51
  • 3.4.3 构建Linux根文件系统51-55
  • 4 说话人识别系统的实现55-63
  • 4.1 系统设计目标与架构55
  • 4.1.1 设计目标55
  • 4.1.2 设计架构55
  • 4.2 系统界面设计55-56
  • 4.3 系统软件模块设计和应用程序流程56-59
  • 4.3.1 语音信号采集播放模块56-57
  • 4.3.2 语音合成模块57-58
  • 4.3.3 应用程序的主要流程58-59
  • 4.4 系统测试59-63
  • 4.4.1 系统测试过程59-60
  • 4.4.2 测试结果与分析60-63
  • 5 结论63-65
  • 参考文献65-69
  • 附录A Bark频率群表69-71
  • 攻读学位期间发表的学术论文71-72
  • 致谢72

【相似文献】

中国期刊全文数据库 前10条

1 石艳;王晓晔;;新颖检测法在说话人识别技术中的应用[J];现代计算机(专业版);2008年07期

2 刘雪燕;张娜;袁宝玲;;说话人识别综述[J];电脑知识与技术;2009年01期

3 邱政权;范小春;王俊年;;基于动态环境下的说话人识别[J];科学技术与工程;2010年02期

4 单进;;说话人识别技术研究[J];科技资讯;2010年21期

5 申志生;于明;;说话人识别算法的定点DSP实现[J];单片机与嵌入式系统应用;2011年03期

6 谢建勋;;浅谈说话人识别技术[J];电脑知识与技术;2011年11期

7 安茂波;刘建;;一个快速说话人识别系统的设计和实现[J];网络新媒体技术;2012年03期

8 杨迪;戚银城;刘明军;张华芳子;武军娜;;说话人识别综述[J];电子科技;2012年06期

9 武光利;;说话人识别方法概述[J];硅谷;2012年19期

10 曹业敏,侯风雷,王炳锡;说话人识别技术现状与进展[J];河南科技;1998年09期

中国重要会议论文全文数据库 前10条

1 鲍福良;方志刚;徐洁;;说话人识别综述[A];第六届全国信息获取与处理学术会议论文集(2)[C];2008年

2 孙帆;迟惠生;;循环网络说话人识别[A];第二届全国人机语音通讯学术会议论文集[C];1992年

3 肖剑;欧贵文;;多层前馈神经网络组的文本无关说话人识别[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年

4 张玲华;郑宝玉;杨震;;模糊超椭球聚类算法及其在说话人识别中的应用研究[A];第八届全国人机语音通讯学术会议论文集[C];2005年

5 王宏;潘金贵;;基于矩阵正态分布的文本有关说话人识别[A];2007通信理论与技术新发展——第十二届全国青年通信学术会议论文集(上册)[C];2007年

6 戴红霞;赵力;;文本无关说话人识别系统的研究[A];2007’促进西部发展声学学术交流会论文集[C];2007年

7 陈联武;郭武;戴礼荣;;说话人识别系统中多样训练的应用[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年

8 崔玉红;胡光锐;;基于神经网络特征维数压缩方法及其在说话人识别中的应用[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年

9 吴丽丽;;基于仿生模式识别的说话人识别学习模型研究[A];第二届中国科学院博士后学术年会暨高新技术前沿与发展学术会议程序册[C];2010年

10 张晶;董金明;冯文全;;说话人识别系统研究与实现[A];全国第二届信号处理与应用学术会议专刊[C];2008年

中国重要报纸全文数据库 前2条

1 汪永安;科大讯飞说话人识别技术世界领先[N];安徽日报;2008年

2 吴长锋;科大讯飞勇夺说话人识别国际大赛第一[N];科技日报;2008年

中国博士学位论文全文数据库 前10条

1 单振宇;情感说话人识别及其解决方法的研究[D];浙江大学;2010年

2 别凡虎;说话人识别中区分性问题的研究[D];清华大学;2015年

3 陆伟;基于缺失特征的文本无关说话人识别鲁棒性研究[D];中国科学技术大学;2008年

4 刘镝;说话人识别中信息融合算法的研究[D];北京交通大学;2011年

5 付中华;说话人识别系统鲁棒性研究[D];西北工业大学;2004年

6 林琳;基于模糊聚类与遗传算法的说话人识别理论研究及应用[D];吉林大学;2007年

7 邱政权;在噪声环境下的说话人识别[D];华南理工大学;2007年

8 郭武;复杂信道下的说话人识别[D];中国科学技术大学;2007年

9 钱博;基于汉语元音映射的说话人识别技术研究[D];南京理工大学;2007年

10 姜涛;网络环境下说话人识别关键技术研究[D];哈尔滨工业大学;2011年

中国硕士学位论文全文数据库 前10条

1 丛菡菡;基于支持相量机的稳键说话人识别[D];电子科技大学;2008年

2 任舒彬;面向手持应用的说话人识别算法研究[D];浙江大学;2006年

3 申志生;文本相关说话人识别嵌入式系统及其关键技术研究[D];河北工业大学;2011年

4 汪q,

本文编号:715984


资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/715984.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户57f2c***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com