一种噪声环境下的复杂声音识别方法
[Abstract]:Nowadays, the society has entered the era of artificial intelligence, speech recognition technology has been quite mature. Because of the complexity and diversity of the sound sources and the interference of background noise, the research on the recognition of complex sound in real life is far from mature, and there are still many problems and defects. Therefore, it is of great practical and theoretical value to study the recognition of complex sound in noisy environment. Complex sound is a kind of sound signal which contains many kinds of sound types and whose boundaries are difficult to distinguish. At present, the detection methods of this kind of sound mainly use the traditional speech recognition technology. The speech signal pronunciation mode is relatively fixed and the energy is stable, and there are many kinds of complex sounds, different pronunciation principles and great instantaneous energy. And it will be interfered by environmental noise, so only traditional speech recognition technology can not be applied to the recognition of complex sound. In order to solve the problem of low accuracy in noise environment, the main work of this paper is as follows: (1) firstly, several time-frequency domain features commonly used in sound recognition are introduced. In the process of studying the method of complex sound recognition in noisy environment, a training sample selection algorithm based on clustering tagging is proposed to overcome the difficulty of manually selecting training samples. The training sample representative set can be selected more quickly and accurately, and the comparison experiments of different clustering methods are carried out. (3) finally, a complex voice recognition framework based on hidden Markov model (Hidden Markov Mode1,HMM) is proposed. Training and recognition are also carried out. The simulation results of two different types of complex sounds, train sounds and bird calls, show that, The time domain feature short time autocorrelation function and the mixed feature parameters of frequency domain feature Mel frequency cepstrum coefficient combination are used to represent the complex sound features, and the training sample selection algorithm based on nearest neighbor propagation clustering is proposed in this paper. The accuracy and efficiency of complex sound recognition in noisy environment can be significantly improved by modeling with HMM model recognition framework.
【学位授予单位】:合肥工业大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TN912.34
【相似文献】
相关期刊论文 前10条
1 ;会找人的机器人[J];科学;2006年01期
2 张宏超;声音识别简介[J];信息与控制;1979年03期
3 刘砾;日研制成功世界上第一个连续声音识别系统[J];国外自动化;1979年Z1期
4 王宪忠;;前景光明的声音识别技术[J];华夏星火;2001年09期
5 郭利刚;方土富;;智能声音识别技术在广播电视广告监测中的应用[J];广播与电视技术;2006年12期
6 施智雄;;基于声音识别的气味发生装置设计与实现[J];电声技术;2009年05期
7 蔡时昊;颜伟国;;智能声音识别技术构建广播电视广告节目监测系统[J];信息通信;2012年03期
8 王再欢;唐云建;韩鹏;;一种利用声音识别的森林盗伐检测方法[J];计算机工程与应用;2012年30期
9 甘振新 ,金世龙;关于声音识别的一些研究课题[J];信息与控制;1979年03期
10 千叶 ,成美 ,刘小立 ,祝景成;声音识别技术的现状与未来[J];国外自动化;1983年02期
相关会议论文 前3条
1 杨曜;郭斌;於志文;;一种基于背景声音识别的社会情境感知方法[A];第八届和谐人机环境联合学术会议(HHME2012)论文集PCC[C];2012年
2 张明瀚;石为人;丁宁;;一种基于学习的异常声音识别研究[A];2009中国仪器仪表与测控技术大会论文集[C];2009年
3 高思泽;倪邦发;张贵英;赵常军;肖才锦;刘存兄;刘超;管永精;;过热液滴探测器的声音识别系统设计[A];第十二届全国活化分析学术交流会论文摘要汇编[C];2010年
相关重要报纸文章 前3条
1 日立邋编译;声音识别:下一代手机输入接口[N];中国电子报;2007年
2 本报驻以色列记者 田学科;藏在舌尖上的“身份证”[N];科技日报;2006年
3 李莉;反恐战场另类“灵眼”[N];中国国防报;2004年
相关博士学位论文 前1条
1 张文娟;基于听觉仿生的目标声音识别系统研究[D];中国科学院研究生院(长春光学精密机械与物理研究所);2012年
相关硕士学位论文 前10条
1 张楠;西湖之声“杭州味道”品牌战略方案评估和建议[D];浙江大学;2015年
2 张苏楠;基于视频跟踪与多模型声音识别的猪行为检测与分析[D];太原理工大学;2016年
3 张小霞;基于能量检测的复杂环境声音识别[D];福州大学;2014年
4 尤冠瑜;基于时间编码的环境声音识别[D];福州大学;2013年
5 王熙;基于多频段谱减法的鲁棒性生态环境声音识别[D];福州大学;2013年
6 颜鑫;真实噪声下利用抗噪幂归一化倒谱系数的两层鲁棒环境声音识别[D];福州大学;2013年
7 史秋莹;基于深度学习和迁移学习的环境声音识别[D];哈尔滨工业大学;2016年
8 崔金琦;Non-Speech Body Sounds的感知、识别与应用研究[D];南京大学;2017年
9 樊鹏;一种噪声环境下的复杂声音识别方法[D];合肥工业大学;2017年
10 胡志峰;基于嵌入式声音识别技术的列车预警研究[D];西南交通大学;2007年
,本文编号:2296724
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/2296724.html