当前位置:主页 > 科技论文 > 信息工程论文 >

融合声纹识别的护理床语音控制系统研发

发布时间:2017-10-02 02:01

  本文关键词:融合声纹识别的护理床语音控制系统研发


  更多相关文章: 声纹识别 语音识别 护理床 GMM DTW


【摘要】:随着人口老龄化的日趋严重、以及心脑血管疾病的年轻化,使得越来越多人丧失行动能力,加上护理人员的缺乏,社会需要加速研发更为智能的护理床。护理床采用语音控制来取代单纯的按钮控制,能够为失能患者带来很大的方便。然而,在养老院以及医院,通常都会有多张护理床处在同一室内,环境相对嘈杂,若是多人同时发送语音命令则容易相互干扰。如果采用非特定人语音控制系统,那么任何人都能够对护理床发送语音命令,将对患者的安全产生严重影响,有可能导致患者二次伤害,这制约着护理床的推广应用。针对这个问题,本文基于Android平台,开发了一套融合了声纹识别的护理床语音控制系统。首先,本文综述了课题的背景知识、研究意义,并介绍了护理床的研发现状,分析了声纹识别以及语音识别的研究现状。本文指出了,尽管语音信号的处理识别技术发展至今已经相当成熟了,然而在目前市场上,能够针对特定患者的声纹特征进行语音识别的护理床控制系统还是缺乏。其次,本文基于用户体验原则,对护理床语音控制系统的需求作了分析,对各种开发平台进行了比对,选择了Android开发平台,然后进行语音控制系统的概要设计。第三,本文探讨常见的音频格式的特点,在Android上采用WAV格式做语音特征提取。然后分析了提取音频文件的数据,并对它做预处理,研究了确定其参数的方法。紧接着是对语音数据进行MFCC特征提取。接着,解决了在Android上编程时,遇到NaN数据的问题,实现在Android平台上的MFCC特征提取。第四,深入探讨了声纹识别以及语音识别的各种算法基础上,选择了GMM作为声纹识别的算法,并在Matlab上做实验进行验证,以及选择HMM和DTW进行Matlab对比实验,实验样本采用个人录制的语音所提取的MFCC特征。实验也证明了,在合理设置阈值的前提下,GMM适合作为控制系统的声纹识别算法,用于屏蔽非护理床用户的语音。也证明了在少量训练样本、识别对象为孤立词的情况下,采用DTW识别效果以及识别时问都优于采用HMM。而后,在Android平台上实现了基于GMM的声纹识别和基于DTW的语音识别。第五,本文根据概要设计、界面设计和流程设计,详细阐述了在Android平台上设计护理床语音控制系统的过程。然后,对语音控制系统进行性能试验。设置阈值后,当声纹识别的召回率为72.5%时,非护理床用户的语音有1.25%的可能致护理床动作。通过了声纹识别后,指定护理床用户的语音识别率为97.13%,而非指定护理床用户的语音识别率为14.29%。指定护理床用户从读入语音到护理床产生动作的过程,需要时间1-2秒。最后,对本课题的工作作了总结和展望,并提出了课题今后应该努力的方向。
【关键词】:声纹识别 语音识别 护理床 GMM DTW
【学位授予单位】:广东工业大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:R472;TN912.3
【目录】:
  • 摘要4-6
  • Abstract6-13
  • 第一章 绪论13-19
  • 1.1 研究背景及意义13
  • 1.2 护理床产业研发现状13-14
  • 1.3 声纹及语音识别技术发展现状14-16
  • 1.3.1 声纹识别技术发展现状14
  • 1.3.2 语音识别技术发展及现状14-15
  • 1.3.3 声纹及语音识别的实现平台发展及现状15-16
  • 1.4 护理床语音控制系统的问题16
  • 1.5 论文的主要研究内容及成果16-17
  • 1.6 本章小结17-19
  • 第二章 护理床语音控制系统的需求分析与概要设计19-25
  • 2.1 护理床语音控制系统的需求分析19-20
  • 2.1.1 需求描述19-20
  • 2.1.2 护理床语音控制系统平台的选择20
  • 2.2 护理床语音控制系统的概要设计20-23
  • 2.2.1 语音控制的护理床系统20-22
  • 2.2.2 护理床语音控制系统上位机软件操作流程22-23
  • 2.3 本章小结23-25
  • 第三章 Android平台上的语音信号特征提取25-43
  • 3.1 在Android上的录音方法25-26
  • 3.2 WAV格式音频信号的预处理26-36
  • 3.2.1 读取WAV音频文件26-27
  • 3.2.2 音频信号预加重27-28
  • 3.2.3 音频信号的加窗分帧28-31
  • 3.2.4 语音的端点检测31-36
  • 3.3 音频信号的下采样36
  • 3.4 语音信号的特征提取36-39
  • 3.4.1 MFCC特征参数提取37-39
  • 3.5 MFCC特征提取方法在Android平台上的实现39-41
  • 3.6 本章小结41-43
  • 第四章 融合声纹识别和语音识别的护理床控制系统43-65
  • 4.1 声纹识别方法43-46
  • 4.1.1 高斯混合模型的原理43-45
  • 4.1.2 高斯混合模型的参数估计45-46
  • 4.2 语音识别方法46-55
  • 4.2.1 隐马尔可夫模型47-52
  • 4.2.2 动态时间规整52-55
  • 4.3 Matlab验证55-61
  • 4.3.1 声纹识别实验56-57
  • 4.3.2 语音识别实验57-61
  • 4.4 GMM与DTW在Android平台上的编程实现61-64
  • 4.4.1 GMM在Android平台上的实现62-63
  • 4.4.2 DTW在Android平台上的实现63-64
  • 4.5 本章小结64-65
  • 第五章 护理床语音控制系统的软件设计与实现65-75
  • 5.1 界面设计65-69
  • 5.2 程序设计69-71
  • 5.2.1 录模板语音69-71
  • 5.2.2 输入待识别语音71
  • 5.3 护理床语音控制系统在Android平台上的实现以及试验71-74
  • 5.4 本章小结74-75
  • 结论和展望75-77
  • 参考文献77-81
  • 攻读学位期间发表的论文81-85
  • 致谢85

【相似文献】

中国重要会议论文全文数据库 前2条

1 杨莹春;雷震春;吴朝晖;;基于情感补偿的活体声纹识别框架研究[A];第一届中国情感计算及智能交互学术会议论文集[C];2003年

2 黄晓丹;洪青阳;李琳;李稀敏;梁大伟;陈万里;吕伟辰;丘敬云;王薇;;声纹识别语音数据库建设的探讨[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年

中国重要报纸全文数据库 前5条

1 闫洁;声纹识别高精尖听音辨人不遥远[N];新华每日电讯;2014年

2 吴玺宏;声纹识别应用前景[N];计算机世界;2001年

3 邢方亮;以声辨人[N];计算机世界;2003年

4 北京大学信息科学中心视觉与听觉信息处理国家重点实验室 吴玺宏;声纹识别听声辨人[N];计算机世界;2001年

5 本报记者 霍娜;云上积累 云中绽放[N];中国计算机报;2014年

中国博士学位论文全文数据库 前1条

1 张晶;声纹识别鲁棒性技术及应用研究[D];广东工业大学;2015年

中国硕士学位论文全文数据库 前10条

1 于娴;声纹识别在微信中的模式匹配研究[D];贵州大学;2015年

2 刘磊;声纹识别算法在军事通话中的研究与实现[D];东北大学;2014年

3 陈俊彬;融合声纹识别的护理床语音控制系统研发[D];广东工业大学;2016年

4 陈燕;用户定制口令声纹识别系统研究与嵌入式实现[D];厦门大学;2009年

5 彭诗雅;基于声纹识别的身份认证技术研究[D];南京航空航天大学;2010年

6 付浩楠;声纹识别在声控系统中的研究与实现[D];黑龙江大学;2012年

7 张转侠;基于双序混合最优码本的声纹识别系统研究[D];重庆大学;2012年

8 徐卫中;基于矢量量化与神经网络的声纹识别系统的研究[D];重庆大学;2012年

9 徐鹤;城市交通环境下声纹识别算法研究[D];吉林大学;2013年

10 裴鑫;声纹识别系统关键技术研究[D];哈尔滨理工大学;2014年



本文编号:956888

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/956888.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户cfddf***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com