当前位置:主页 > 科技论文 > 信息工程论文 >

语谱特征的身份认证向量识别方法

发布时间:2018-04-16 00:16

  本文选题:语谱图 + 身份认证向量 ; 参考:《重庆大学学报》2017年05期


【摘要】:针对采用梅尔频率倒谱系数(mel-frequency cepstrum coefficient,MFCC)作为身份认证向量(identity vector,i-vector)进行说话人识别存在语音信息不全的问题,提出一种基于语谱特征的身份认证向量识别说话人的方法。语音信号经过预加重、分帧加窗预处理之后,通过短时傅立叶变换转换成语谱图,语谱图被提交到高斯通用背景模型,在高维均值超向量空间中选择合适的低维线性子空间流型结构以构造符合正态分布的向量作为身份认证向量。这些获取的身份认证向量经过线性判别性分析实现降维并存储。最后采用对数似然比(log-likelihood ratio,LLR)方法对训练和测试阶段的i-vector进行评分,完成说话人识别。以TIMIT数据库为标准的数值实验结果表明,相比采用MFCC作为特征的识别方法,研究的等错误率(equal error rate,EER)更低。
[Abstract]:In order to solve the problem of speaker recognition using Mel frequency cepstrum coefficients (Mel frequency cepstrum coefficients) as identity vector (identity vectori-vectorr), a speech recognition method based on spectral features is proposed.The speech signal was pre-accentuated, pre-processed by framing and windowed, and converted into a spectral map by short-time Fourier transform, which was submitted to Gao Si's general background model.The appropriate low-dimensional linear subspace flow pattern structure is selected in the high-dimensional mean hypervector space to construct the normal distribution vector as the identity authentication vector.The obtained authentication vectors are reduced and stored by linear discriminant analysis.Finally, the log-like likelihood ratio (LLR) method was used to score the i-vector in the training and testing stages, and the speaker recognition was completed.The numerical results based on TIMIT database show that the equal error rate is lower than that using MFCC as the feature recognition method.
【作者单位】: 重庆邮电大学汽车电子实验室;
【基金】:重庆市教育成果转化基金资助项目(KJZH14207)~~
【分类号】:TN912.3

【相似文献】

相关期刊论文 前10条

1 石艳;王晓晔;;新颖检测法在说话人识别技术中的应用[J];现代计算机(专业版);2008年07期

2 刘雪燕;张娜;袁宝玲;;说话人识别综述[J];电脑知识与技术;2009年01期

3 邱政权;范小春;王俊年;;基于动态环境下的说话人识别[J];科学技术与工程;2010年02期

4 单进;;说话人识别技术研究[J];科技资讯;2010年21期

5 申志生;于明;;说话人识别算法的定点DSP实现[J];单片机与嵌入式系统应用;2011年03期

6 谢建勋;;浅谈说话人识别技术[J];电脑知识与技术;2011年11期

7 安茂波;刘建;;一个快速说话人识别系统的设计和实现[J];网络新媒体技术;2012年03期

8 杨迪;戚银城;刘明军;张华芳子;武军娜;;说话人识别综述[J];电子科技;2012年06期

9 武光利;;说话人识别方法概述[J];硅谷;2012年19期

10 曹业敏,侯风雷,王炳锡;说话人识别技术现状与进展[J];河南科技;1998年09期

相关会议论文 前10条

1 鲍福良;方志刚;徐洁;;说话人识别综述[A];第六届全国信息获取与处理学术会议论文集(2)[C];2008年

2 孙帆;迟惠生;;循环网络说话人识别[A];第二届全国人机语音通讯学术会议论文集[C];1992年

3 肖剑;欧贵文;;多层前馈神经网络组的文本无关说话人识别[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年

4 张玲华;郑宝玉;杨震;;模糊超椭球聚类算法及其在说话人识别中的应用研究[A];第八届全国人机语音通讯学术会议论文集[C];2005年

5 王宏;潘金贵;;基于矩阵正态分布的文本有关说话人识别[A];2007通信理论与技术新发展——第十二届全国青年通信学术会议论文集(上册)[C];2007年

6 戴红霞;赵力;;文本无关说话人识别系统的研究[A];2007’促进西部发展声学学术交流会论文集[C];2007年

7 陈联武;郭武;戴礼荣;;说话人识别系统中多样训练的应用[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年

8 崔玉红;胡光锐;;基于神经网络特征维数压缩方法及其在说话人识别中的应用[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年

9 吴丽丽;;基于仿生模式识别的说话人识别学习模型研究[A];第二届中国科学院博士后学术年会暨高新技术前沿与发展学术会议程序册[C];2010年

10 张晶;董金明;冯文全;;说话人识别系统研究与实现[A];全国第二届信号处理与应用学术会议专刊[C];2008年

相关博士学位论文 前10条

1 单振宇;情感说话人识别及其解决方法的研究[D];浙江大学;2010年

2 别凡虎;说话人识别中区分性问题的研究[D];清华大学;2015年

3 谢怡宁;基于稀疏编码的鲁棒说话人识别方法研究[D];哈尔滨理工大学;2016年

4 安冬;噪声背景下说话人识别的若干关键问题研究[D];东北大学;2013年

5 吴迪;低信噪比环境下说话人识别研究[D];苏州大学;2016年

6 酆勇;基于深度学习的说话人识别建模研究[D];重庆大学;2016年

7 陈英;基于含噪短语音的鲁棒说话人识别研究[D];南京理工大学;2015年

8 陆伟;基于缺失特征的文本无关说话人识别鲁棒性研究[D];中国科学技术大学;2008年

9 刘镝;说话人识别中信息融合算法的研究[D];北京交通大学;2011年

10 付中华;说话人识别系统鲁棒性研究[D];西北工业大学;2004年

相关硕士学位论文 前10条

1 丛菡菡;基于支持相量机的稳键说话人识别[D];电子科技大学;2008年

2 任舒彬;面向手持应用的说话人识别算法研究[D];浙江大学;2006年

3 申志生;文本相关说话人识别嵌入式系统及其关键技术研究[D];河北工业大学;2011年

4 汪q,

本文编号:1756451


资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/1756451.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户392c5***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com