复杂噪声场景下的活动语音检测方法
本文选题:说话人识别 切入点:活动语音检测 出处:《清华大学学报(自然科学版)》2016年11期
【摘要】:该文提出一种适用于各种复杂噪声场景下的鲁棒性活动语音检测方法。采用能量、主频率分量和短时谱熵3种声学参数形成三维特征,这3种参数在各种各样的噪声中表现出很强的互补性;在活动语音脉冲检测中,采用K均值聚类算法自适应地选择特征并且计算语音检测过程中所用到的阈值。在美国国家标准与技术研究院说话人评测2008和2012年任务上进行实验,结果表明:所提出的方法在各种不同噪声环境下均具有较好的性能,相比传统的非监督和有监督活动语音检测算法更加鲁棒高效。
[Abstract]:In this paper, a robust active speech detection method for various complex noise scenarios is proposed. Three acoustic parameters, energy, main frequency component and short-time spectral entropy, are used to form 3D features. These three parameters are highly complementary to each other in all kinds of noise, and in active speech pulse detection, The K-means clustering algorithm is used to adaptively select features and calculate the thresholds used in speech detection. The experiments were carried out on the speaker assessment tasks of the National Institute of Standards and Technology in 2008 and 2012. The results show that the proposed method has better performance in different noise environments and is more robust and efficient than the traditional unsupervised and supervised active speech detection algorithms.
【作者单位】: 中国科学技术大学信息科学技术学院语音及语言信息处理国家工程实验室;
【基金】:国家重点研发计划项目(2016YFB1001300)
【分类号】:TN912.3
【相似文献】
相关期刊论文 前10条
1 温洪昌;黄应强;傅贵兴;;单片机的多段语音组合录放系统设计[J];单片机与嵌入式系统应用;2011年10期
2 张剑;袁华强;;Rhetorical-State SVM在抽取式语音摘要中的应用[J];科学技术与工程;2013年21期
3 卢坚 ,毛兵 ,孙正兴 ,张福炎;一种改进的基于说话者的语音分割算法[J];软件学报;2002年02期
4 章文义,朱杰;几种无语音检测噪音估计方法的比较研究[J];计算机工程与设计;2003年10期
5 章钊;郭武;;话者识别中结合模型和能量的语音激活检测算法[J];小型微型计算机系统;2010年09期
6 李艳雄;贺前华;陈楠;齐朝晖;;基于谱稳定性特征的语音与笑声区分新方法[J];电子与信息学报;2008年06期
7 高福友;陈雁翔;;一种基于说话者的无监督语音分割算法[J];合肥工业大学学报(自然科学版);2010年05期
8 Takao ,刘吉峰;语音接口[J];今日电子;1996年Z1期
9 刘娟花;李福德;;一种改进的小波域语音去噪方法研究[J];西安工程科技学院学报;2006年01期
10 张江安,杨洪柏,林良明,颜国正;一种基于段间距离测度的语音自动分割方法[J];上海交通大学学报;2001年09期
相关会议论文 前6条
1 田野;王作英;陆大金;;基于韵律结构信息的非语音拒识[A];第六届全国人机语音通讯学术会议论文集[C];2001年
2 徐明;胡瑞敏;黄云森;;基于音素识别的语音评价方法[A];第二届和谐人机环境联合学术会议(HHME2006)——第15届中国多媒体学术会议(NCMT'06)论文集[C];2006年
3 王欢良;韩纪庆;李海峰;王承发;;面向嵌入式应用的小词汇量语音串识别系统[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
4 简志华;王向文;;考虑帧间信息的语音转换算法[A];浙江省信号处理学会2012学术年会论文集[C];2012年
5 魏维;马海燕;;一种丢失语音信包重建的新算法[A];通信理论与信号处理新进展——2005年通信理论与信号处理年会论文集[C];2005年
6 陈凡;罗四维;;一个实用语音开发应用系统的设计与实现[A];第二届全国人机语音通讯学术会议论文集[C];1992年
相关重要报纸文章 前3条
1 atvoc;数码语音电路产品概述[N];电子资讯时报;2008年
2 记者 李山;德用双音素改进人工语音表达[N];科技日报;2012年
3 江西 林慧勇;语音合成芯片MSM6295及其应用[N];电子报;2006年
相关博士学位论文 前9条
1 高伟勋;智能家居环境中个性化语音生成关键技术研究[D];东华大学;2015年
2 陈丽萍;说话人确认中语音段差异建模相关问题的研究[D];中国科学技术大学;2016年
3 何俊;声纹身份识别中非常态语音应对方法研究[D];华南理工大学;2012年
4 双志伟;个性化语音生成研究[D];中国科学技术大学;2011年
5 古今;语音感知认证的关键技术研究[D];中国科学技术大学;2009年
6 彭波;Internet上语音的鲁棒性传输研究[D];华南理工大学;2001年
7 黄湘松;基于混淆网络的汉语语音检索技术研究[D];哈尔滨工程大学;2010年
8 应娜;基于正弦语音模型的低比特率宽带语音编码算法的研究[D];吉林大学;2006年
9 田立斌;语音通信质量客观评价、有效接收及错误恢复算法研究[D];华南理工大学;2004年
相关硕士学位论文 前10条
1 张占松;基于DSP的语音干扰方法研究与实现[D];北京交通大学;2016年
2 李鹏;基于系统融合的语音查询项检索技术研究[D];解放军信息工程大学;2015年
3 赵蓉蓉;基于计算听觉场景分析的单通道语音盲分离技术[D];太原理工大学;2016年
4 崔瑞莲;语种识别中的语音段表示方法研究[D];中国科学技术大学;2016年
5 陈宇超;广播语音的分割与分类研究[D];北京邮电大学;2009年
6 何明哲;语音片段检索算法的研究与应用[D];华南理工大学;2012年
7 邸燕君;基于感知哈希的语音内容认证方法研究[D];兰州理工大学;2013年
8 龚小燕;极低速率语音通信的实现[D];山东大学;2009年
9 朱春雷;优化自适应非平行训练语音转换算法研究[D];苏州大学;2013年
10 李金中;多参数驱动的年龄语音转换系统[D];中国科学技术大学;2015年
,本文编号:1663466
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/1663466.html