当前位置:主页 > 科技论文 > 信息工程论文 >

基于噪声分类和字典选择的语音活动检测

发布时间:2018-01-07 23:31

  本文关键词:基于噪声分类和字典选择的语音活动检测 出处:《华中科技大学学报(自然科学版)》2016年12期  论文类型:期刊论文


  更多相关文章: 语音活动检测 稀疏编码 形态成分分析 K-奇异值分解 噪声鲁棒性


【摘要】:为了解决已有语音活动检测方法在噪声条件下性能急剧下降的问题,提出了一种基于稀疏编码的语音活动检测方法.该方法在训练阶段为语音和每种可能的噪声训练字典;在识别阶段首先识别环境噪声类型,然后将语音字典和对应环境噪声字典拼接形成一个大字典用于稀疏分解,最后用语音字典上的稀疏表示实现语音和非语音的判断.该方法一方面引入了噪声类型识别,可以有针对性地选择噪声字典;另一方面引入噪声开集识别机制,能识别新的噪声类型并且为之训练模型.实验结果表明所提方法比传统方法具有更强的噪声鲁棒性.
[Abstract]:In order to solve the existing voice activity detection method in noise condition performance degradation problem, proposes a voice activity detection method based on sparse encoding. In the training stage for voice and every possible noise training dictionary; first to identify environmental noise types at the recognition stage, then the speech dictionary and the corresponding environmental noise the dictionary spliced into a large dictionary for sparse decomposition, finally using sparse speech dictionary representation on Realization of speech and non speech judgment. This method introduces noise type identification, can be selected according to the noise of the dictionary; on the other hand, the noise introduced by the open set recognition mechanism, and can identify new types of noise the training model. The experimental results show that the noise robustness of the proposed method has better than the traditional method.

【作者单位】: 哈尔滨理工大学计算机科学与技术学院;哈尔滨理工大学自动化学院;
【基金】:国家自然科学基金青年基金资助项目(61305001)
【分类号】:TN912.3
【正文快照】: 语音活动检测(voice activity detector)的目的是为了确定信号中语音的起始点和终止点,通常被应用于语音编码、语音增强、语音识别等语音处理系统中,具有降低语音编码速率、节省通信带宽、减少设备能耗和提高识别率等作用[1].该技术具有十分重要的理论研究和实际应用价值,一直

【相似文献】

相关期刊论文 前10条

1 晁永国;戴芳;韩舒然;何静;;改进的非负稀疏编码图像基学习算法[J];计算机工程与科学;2010年01期

2 谢尧芳;苏松志;李绍滋;;基于稀疏编码的迁移学习及其在行人检测中的应用[J];厦门大学学报(自然科学版);2010年02期

3 郎利影;夏飞佳;;人脸识别中的零范数稀疏编码[J];应用科学学报;2012年03期

4 程东阳;蒋兴浩;孙锬锋;;基于稀疏编码和多核学习的图像分类算法[J];上海交通大学学报;2012年11期

5 邹柏贤;苗军;;自然图像稀疏编码模型研究综述[J];郑州大学学报(工学版);2013年03期

6 刘伟锋;刘红丽;王延江;;基于多分离部件稀疏编码的人脸图像分析[J];模式识别与人工智能;2013年11期

7 张抒;蔡勇;解梅;;基于局部区域稀疏编码的人脸检测[J];软件学报;2013年11期

8 单桂军;廖建锋;;最大似然稀疏编码在人脸识别中的研究[J];电视技术;2013年23期

9 王瑞霞;彭国华;郑红婵;;拉普拉斯稀疏编码的图像检索算法[J];计算机科学;2014年08期

10 钱乐乐;高隽;谢昭;;一种融合神经稀疏编码机制的层次目标识别算法[J];中国图象图形学报;2010年10期

相关会议论文 前3条

1 尚丽;;使用正态可逆高斯密度模型的非负稀疏编码收缩技术实现图像消噪[A];苏州市自然科学优秀学术论文汇编(2008-2009)[C];2010年

2 刘扬;程健;卢汉清;;基于目标局部特征的迁移式学习[A];第十四届全国图象图形学学术会议论文集[C];2008年

3 张莹莹;梁培基;;视网膜神经元的高效信息处理[A];第十一次中国生物物理学术大会暨第九届全国会员代表大会摘要集[C];2009年

相关博士学位论文 前10条

1 唐海峰;基于信号稀疏表征的故障诊断方法研究[D];上海交通大学;2014年

2 孙宇平;基于稀疏表征和自相似性的视觉数据识别关键技术及应用[D];华南理工大学;2015年

3 李清勇;视觉感知的稀疏编码理论及其应用研究[D];中国科学院研究生院(计算技术研究所);2006年

4 季昊;稀疏编码研究及其在模式识别中的应用[D];北京邮电大学;2012年

5 孙俊;人脸图像分析和识别方法研究[D];清华大学;2001年

6 朱秋平;基于稀疏编码的织物瑕疵检测算法研究[D];武汉大学;2014年

7 罗敏楠;T-S模糊推理系统的结构稀疏编码辨识理论与方法[D];清华大学;2014年

8 谢锦生;基于动态感知与异常注意的目标描述方法研究[D];中国科学技术大学;2012年

9 刘小白;图像及视频语义解析的关键技术研究[D];华中科技大学;2012年

10 丁昕苗;基于多示例学习的恐怖视频识别技术研究[D];中国矿业大学(北京);2013年

相关硕士学位论文 前10条

1 柏文强;基于局部特征提取和稀疏编码的人脸识别算法研究[D];燕山大学;2015年

2 李明;目标检测与识别算法研究与应用[D];中央民族大学;2015年

3 许涛;面向视频管理的指纹特征提取技术研究[D];电子科技大学;2015年

4 鲍珍珍;基于多路分层稀疏编码的遥感图像场景分类[D];西安电子科技大学;2014年

5 覃晓冰;基于稀疏编码的语音去噪技术研究[D];电子科技大学;2015年

6 谢易道;大规模人脸图像编码及其在人脸验证中的应用研究[D];电子科技大学;2015年

7 勾珍珍;基于空间约束和稀疏编码的高光谱图像分类[D];西安电子科技大学;2014年

8 黄成;基于非负稀疏编码的视频拷贝检测方法研究[D];湘潭大学;2015年

9 张文义;基于智能监控系统的图像质量增强算法的研究[D];南京邮电大学;2015年

10 丁文秀;基于分层深度学习的行人分类方法研究[D];合肥工业大学;2015年



本文编号:1394727

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/1394727.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户72860***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com