当前位置:主页 > 科技论文 > 信息工程论文 >

一种噪声环境下的复杂声音识别方法

发布时间:2018-10-26 19:27
【摘要】:当今社会已进入人工智能的时代,语音识别技术已经相当成熟。而对于实际生活中的复杂声音,由于其声源的复杂性和多样性,加之背景噪声的干扰,目前对于这一领域的识别研究还远远不够成熟,仍然存在许多问题和缺陷。因此对噪声环境下复杂声音的识别研究具有非常重大的实践价值和理论价值。复杂声音是指这样一类包含多种声音类型且这些声音之间的边界难以区分的声音信号。目前对于这类声音的检测方法主要沿用传统的语音识别技术,语音信号发音方式较为固定且能量平稳,而复杂声音种类繁多,发音原理各不相同,瞬间能量也较大,而且还会被环境噪音所干扰,因此仅仅采用传统的语音识别技术不能够较好地应用于复杂声音的识别。针对噪声环境下这一类声音识别准确率低的问题,本文主要进行了如下研究工作:(1)首先主要介绍了声音识别中常用的几种时频域特征,通过提取和分析复杂声音样本的特征参数,提出了由时频域特征组合的方式来共同描述复杂声音,并进行了多种混合特征的对比实验。(2)在对噪声环境下的复杂声音识别方法研究过程中,针对人工选择训练样本的困难,提出了一种基于聚类标注的训练样本选择算法,能够更加快速精准地选择出训练样本代表集,并进行了不同聚类方法的对比实验。(3)最后提出了基于隐马尔可夫模型(Hidden Markov Mode1,HMM)的复杂声音识别框架,并进行了训练和识别。通过对列车声音以及鸟叫声两种不同类型的复杂声音进行仿真实验,结果表明,利用时域特征短时自相关函数以及频域特征梅尔频率倒谱系数组合的混合特征参数表示复杂声音特征,使用本文提出的基于近邻传播聚类标注的训练样本选择算法,以及通过HMM模型识别框架进行建模,可以显著提高噪声环境下复杂声音的识别准确率和效率。
[Abstract]:Nowadays, the society has entered the era of artificial intelligence, speech recognition technology has been quite mature. Because of the complexity and diversity of the sound sources and the interference of background noise, the research on the recognition of complex sound in real life is far from mature, and there are still many problems and defects. Therefore, it is of great practical and theoretical value to study the recognition of complex sound in noisy environment. Complex sound is a kind of sound signal which contains many kinds of sound types and whose boundaries are difficult to distinguish. At present, the detection methods of this kind of sound mainly use the traditional speech recognition technology. The speech signal pronunciation mode is relatively fixed and the energy is stable, and there are many kinds of complex sounds, different pronunciation principles and great instantaneous energy. And it will be interfered by environmental noise, so only traditional speech recognition technology can not be applied to the recognition of complex sound. In order to solve the problem of low accuracy in noise environment, the main work of this paper is as follows: (1) firstly, several time-frequency domain features commonly used in sound recognition are introduced. In the process of studying the method of complex sound recognition in noisy environment, a training sample selection algorithm based on clustering tagging is proposed to overcome the difficulty of manually selecting training samples. The training sample representative set can be selected more quickly and accurately, and the comparison experiments of different clustering methods are carried out. (3) finally, a complex voice recognition framework based on hidden Markov model (Hidden Markov Mode1,HMM) is proposed. Training and recognition are also carried out. The simulation results of two different types of complex sounds, train sounds and bird calls, show that, The time domain feature short time autocorrelation function and the mixed feature parameters of frequency domain feature Mel frequency cepstrum coefficient combination are used to represent the complex sound features, and the training sample selection algorithm based on nearest neighbor propagation clustering is proposed in this paper. The accuracy and efficiency of complex sound recognition in noisy environment can be significantly improved by modeling with HMM model recognition framework.
【学位授予单位】:合肥工业大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TN912.34

【相似文献】

相关期刊论文 前10条

1 ;会找人的机器人[J];科学;2006年01期

2 张宏超;声音识别简介[J];信息与控制;1979年03期

3 刘砾;日研制成功世界上第一个连续声音识别系统[J];国外自动化;1979年Z1期

4 王宪忠;;前景光明的声音识别技术[J];华夏星火;2001年09期

5 郭利刚;方土富;;智能声音识别技术在广播电视广告监测中的应用[J];广播与电视技术;2006年12期

6 施智雄;;基于声音识别的气味发生装置设计与实现[J];电声技术;2009年05期

7 蔡时昊;颜伟国;;智能声音识别技术构建广播电视广告节目监测系统[J];信息通信;2012年03期

8 王再欢;唐云建;韩鹏;;一种利用声音识别的森林盗伐检测方法[J];计算机工程与应用;2012年30期

9 甘振新 ,金世龙;关于声音识别的一些研究课题[J];信息与控制;1979年03期

10 千叶 ,成美 ,刘小立 ,祝景成;声音识别技术的现状与未来[J];国外自动化;1983年02期

相关会议论文 前3条

1 杨曜;郭斌;於志文;;一种基于背景声音识别的社会情境感知方法[A];第八届和谐人机环境联合学术会议(HHME2012)论文集PCC[C];2012年

2 张明瀚;石为人;丁宁;;一种基于学习的异常声音识别研究[A];2009中国仪器仪表与测控技术大会论文集[C];2009年

3 高思泽;倪邦发;张贵英;赵常军;肖才锦;刘存兄;刘超;管永精;;过热液滴探测器的声音识别系统设计[A];第十二届全国活化分析学术交流会论文摘要汇编[C];2010年

相关重要报纸文章 前3条

1 日立邋编译;声音识别:下一代手机输入接口[N];中国电子报;2007年

2 本报驻以色列记者 田学科;藏在舌尖上的“身份证”[N];科技日报;2006年

3 李莉;反恐战场另类“灵眼”[N];中国国防报;2004年

相关博士学位论文 前1条

1 张文娟;基于听觉仿生的目标声音识别系统研究[D];中国科学院研究生院(长春光学精密机械与物理研究所);2012年

相关硕士学位论文 前10条

1 张楠;西湖之声“杭州味道”品牌战略方案评估和建议[D];浙江大学;2015年

2 张苏楠;基于视频跟踪与多模型声音识别的猪行为检测与分析[D];太原理工大学;2016年

3 张小霞;基于能量检测的复杂环境声音识别[D];福州大学;2014年

4 尤冠瑜;基于时间编码的环境声音识别[D];福州大学;2013年

5 王熙;基于多频段谱减法的鲁棒性生态环境声音识别[D];福州大学;2013年

6 颜鑫;真实噪声下利用抗噪幂归一化倒谱系数的两层鲁棒环境声音识别[D];福州大学;2013年

7 史秋莹;基于深度学习和迁移学习的环境声音识别[D];哈尔滨工业大学;2016年

8 崔金琦;Non-Speech Body Sounds的感知、识别与应用研究[D];南京大学;2017年

9 樊鹏;一种噪声环境下的复杂声音识别方法[D];合肥工业大学;2017年

10 胡志峰;基于嵌入式声音识别技术的列车预警研究[D];西南交通大学;2007年



本文编号:2296724

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/2296724.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户68751***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com