基于变分贝叶斯改进的说话人聚类算法
本文选题:说话人聚类 + 贝叶斯信息准则 ; 参考:《数据采集与处理》2017年01期
【摘要】:说话人聚类是说话人分离中的一个重要过程,然而传统的以贝叶斯信息准则作为距离测度的层次聚类方式,会出现聚类误差向上传递的情况。本文提出了一种逐级算法增强处理机制。当片段之间的最小贝叶斯信息准则距离超过设定的门限值时,或者类别个数到达一定程度时,将当前聚类结果作为初始类中心,通过变分贝叶斯迭代法重新对每个类别中的片段调优,最后再依据概率线性判别分析得分门限确定说话人个数。实验表明,本文方法在美国国家标准技术署08summed测试集上,使得"类纯度"和"说话人纯度"比传统算法都有了一定提升,且使得说话人分离整体性能相对提升了27.6%。
[Abstract]:Speaker clustering is an important process in speaker separation. However, the traditional hierarchical clustering with Bayesian information criterion as distance measure will result in the upward transmission of clustering errors. In this paper, a step by step algorithm enhancement mechanism is proposed. When the minimum Bayesian information criterion distance between segments exceeds the set threshold, or when the number of classes reaches a certain degree, the current clustering results are taken as the initial cluster center. Finally, the number of speakers is determined according to the score threshold of probabilistic linear discriminant analysis (PLDA). Experiments show that the proposed method can improve the "class purity" and "speaker purity" in the 08summed test set of American National Standards and Technology Agency, and improve the overall performance of speaker separation by 27.6g.
【作者单位】: 公安部物证鉴定中心;中国科学技术大学电子科学与技术系;
【基金】:公安部应用创新计划(2014YYCXGAES048)资助项目
【分类号】:TN912.3
【相似文献】
相关期刊论文 前10条
1 丁辉;唐振民;钱博;李燕萍;;易扩展小样本环境说话人辨认系统的研究[J];系统仿真学报;2008年10期
2 刘明辉;黄中伟;熊继平;;用于说话人辨识的评分规整[J];计算机工程与应用;2010年12期
3 陈雪芳;杨继臣;;一种三层判决的说话人索引算法[J];计算机工程;2012年02期
4 杨继臣;何俊;李艳雄;;一种基于性别的说话人索引算法[J];计算机工程与科学;2012年06期
5 何致远,胡起秀,徐光yP;两级决策的开集说话人辨认方法[J];清华大学学报(自然科学版);2003年04期
6 殷启新,韩春光,杨鉴;基于掌上电脑录音的说话人辨认[J];云南民族学院学报(自然科学版);2003年04期
7 吕声,尹俊勋;同语种说话人转换的实现[J];移动通信;2004年S3期
8 董明,刘加,刘润生;快速口音自适应的动态说话人选择性训练[J];清华大学学报(自然科学版);2005年07期
9 曹敏;王浩川;;说话人自动识别技术研究[J];中州大学学报;2007年02期
10 王坚;;基于支撑向量选择的说话人自适应[J];中国新通信;2007年11期
相关会议论文 前10条
1 司罗;胡起秀;金琴;;完全无监督的双人对话中的说话人分隔[A];第九届全国信号处理学术年会(CCSP-99)论文集[C];1999年
2 金乃高;侯刚;王学辉;李非墨;;基于主动感知的音视频联合说话人跟踪方法[A];2010年通信理论与信号处理学术年会论文集[C];2010年
3 马勇;鲍长春;夏丙寅;;基于辨别性深度信念网络的说话人分割[A];第十二届全国人机语音通讯学术会议(NCMMSC'2013)论文集[C];2013年
4 白俊梅;张树武;徐波;;广播电视中的目标说话人跟踪技术[A];第八届全国人机语音通讯学术会议论文集[C];2005年
5 索宏彬;刘晓星;;基于高斯混合模型的说话人跟踪系统[A];第八届全国人机语音通讯学术会议论文集[C];2005年
6 罗海风;龙长才;;多话者环境下说话人辨识听觉线索研究[A];中国声学学会2009年青年学术会议[CYCA’09]论文集[C];2009年
7 王刚;邬晓钧;郑方;王琳琳;张陈昊;;基于参考说话人模型和双层结构的说话人辨认快速算法[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
8 李经伟;;语体转换与角色定位[A];全国语言与符号学研究会第五届研讨会论文摘要集[C];2002年
9 王刚;邬晓钧;郑方;王琳琳;张陈昊;;基于参考说话人模型和双层结构的说话人辨认[A];第十一届全国人机语音通讯学术会议论文集(二)[C];2011年
10 何磊;方棣棠;吴文虎;;说话人聚类与模型自适应结合的说话人自适应方法[A];第六届全国人机语音通讯学术会议论文集[C];2001年
相关重要报纸文章 前3条
1 ;做一名积极的倾听者[N];中国纺织报;2003年
2 唐志强;不听别人说话,也能模仿其口音[N];新华每日电讯;2010年
3 黄惠慧(南京师范大学附属扬子中学);高考听力要求及对策[N];中国教育资讯报;2002年
相关博士学位论文 前10条
1 李洪儒;语句中的说话人形象[D];黑龙江大学;2003年
2 李威;多人会话语音中的说话人角色分析[D];华南理工大学;2015年
3 杨继臣;说话人信息分析及其在多媒体检索中的应用研究[D];华南理工大学;2010年
4 郑建炜;基于核方法的说话人辨认模型研究[D];浙江工业大学;2010年
5 吕声;说话人转换方法的研究[D];华南理工大学;2004年
6 陈凌辉;说话人转换建模方法研究[D];中国科学技术大学;2013年
7 玄成君;基于语音频率特性抑制音素影响的说话人特征提取[D];天津大学;2014年
8 李燕萍;说话人辨认中的特征参数提取和鲁棒性技术研究[D];南京理工大学;2009年
9 徐利敏;说话人辨认中的特征变换和鲁棒性技术研究[D];南京理工大学;2008年
10 王坚;语音识别中的说话人自适应研究[D];北京邮电大学;2007年
相关硕士学位论文 前10条
1 杨浩;基于广义音素的文本无关说话人认证的研究[D];北京邮电大学;2008年
2 史梦洁;构式“没有比X更Y的(了)”研究[D];上海师范大学;2015年
3 魏君;“说你什么好”的多角度研究[D];河北大学;2015年
4 解冬悦;互动韵律:英语多人冲突性话语中说话人的首音模式研究[D];大连外国语大学;2015年
5 朱韦巍;扬州街上话语气词研究[D];南京林业大学;2015年
6 蒋博;特定目标说话人的语音转换系统设计[D];电子科技大学;2015年
7 王雅丹;汉语反语研究[D];南昌大学;2015年
8 陈雨莺;基于EMD的说话人特征参数提取方法研究[D];湘潭大学;2015年
9 单燕燕;变音环境下鲁棒性说话人辨认关键技术研究[D];南京邮电大学;2015年
10 陈sネ,
本文编号:1828195
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/1828195.html