当前位置:主页 > 科技论文 > 网络通信论文 >

差分和加权Mel倒谱混合参数应用于说话人识别

发布时间:2018-04-25 04:17

  本文选题:说话人识别 + 加权Mel频率倒谱系数 ; 参考:《微电子学与计算机》2014年09期


【摘要】:说话人识别是信息技术和生物学的新一代身份验证方式,在说话人识别的研究中,特征参数的提取直接影响到识别系统最终的识别效率.通过对Mel频率倒谱系数特征参数进行分析研究,基于Mel频率倒谱系数改进加权函数,将体现个人语音特性的加权特征参数与反映语音帧间变化的差分Mel频率倒谱系数进行维度筛选,再进行参数混合.实验结果表明,通过改进加权函数提取得到的特征参数与差分Mel频率倒谱系数的混合参数在矢量量化的说话人识别系统中,码本容量为16和32时可以达到100%的识别率.
[Abstract]:Speaker recognition is a new generation of authentication in information technology and biology. In the research of speaker recognition, the extraction of feature parameters directly affects the final recognition efficiency of the recognition system. By analyzing the characteristic parameters of Mel frequency cepstrum coefficient, the weighting function is improved based on Mel frequency cepstrum coefficient. The weighted feature parameters which reflect the individual speech characteristics and the difference Mel frequency cepstrum coefficients which reflect the variation of speech frames are selected in dimension and then the parameters are mixed. The experimental results show that the mixed parameters of the characteristic parameters extracted by the improved weighting function and the Cepstrum coefficients of the differential Mel frequency can achieve a recognition rate of 100% when the codebook capacity is 16 and 32 in the vector quantized speaker recognition system.
【作者单位】: 桂林电子科技大学电子工程与自动化学院;桂林电子科技大学信息与通信学院;
【基金】:广西自然科学基金(2012GXNSFAA053221) 国家自然科学基金(61363005)
【分类号】:TN912.34

【相似文献】

相关期刊论文 前10条

1 崔玉红,胡光锐,何旭明;基于混合进化计算的GMM优化方法及其在说话人辨认中的应用[J];应用科学学报;2002年02期

2 林平澜;王仁华;;动态HMM及其在说话人识别中的应用[J];信号处理;1993年04期

3 周静芳,陈一宁,李科,刘加;基于高斯语音滤波的稳健文本无关说话人识别[J];计算机工程;2005年02期

4 邓浩江,王守觉,邢藏菊,李倩;基于聚类统计与文本无关的说话人识别研究[J];电路与系统学报;2001年03期

5 王炜,王炳锡,王波;信道补偿技术的发展及其在说话人识别上的应用[J];电声技术;2004年04期

6 韩雁,陈利华;说话人计算机识别系统的设计与实现[J];浙江大学学报(工学版);2001年02期

7 吴晓娟,韩先花,聂开宝;模糊C-均值(FCM)聚类法与矢量量化法相结合用于说话人识别[J];电子与信息学报;2002年06期

8 单进;;说话人识别技术研究[J];科技资讯;2010年21期

9 戴红霞,赵力;采用帧概率变换的与文本无关说话人识别系统的实现[J];电声技术;2004年09期

10 刘雅琴,杜海明;基于矢量量化的说话人识别[J];洛阳师范学院学报;2005年05期

相关会议论文 前10条

1 李桂春;郑能恒;李霞;;基于模糊隶属值加权的MFCC特征提取算法[A];第七届和谐人机环境联合学术会议(HHME2011)论文集【poster】[C];2011年

2 司罗;胡起秀;金琴;;完全无监督的双人对话中的说话人分隔[A];第九届全国信号处理学术年会(CCSP-99)论文集[C];1999年

3 周昊朗;王岚;陈珂;;一个面向说话人识别的汉语语音数据库[A];第六届全国人机语音通讯学术会议论文集[C];2001年

4 周昊朗;王岚;吴玺宏;迟惠生;;一个面向说话人识别的汉语语音数据库[A];信号与信息处理技术——第一届信号与信息处理联合学术会议论文集[C];2002年

5 侯丽敏;谢娟敏;;共振峰瞬时频率特征用于说话人识别[A];第九届中国语音学学术会议论文集[C];2010年

6 周静芳;陈一宁;刘润生;;一种新的说话人识别信道补偿技术[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年

7 吴志强;陈珂;迟惠生;;语音识别技术与说话人识别技术的结合——文本无关说话人识别的另一种方法[A];第四届全国人机语音通讯学术会议论文集[C];1996年

8 卓群;欧贵文;;基于模糊高斯混合模型的说话人识别算法的一些改进[A];第六届全国人机语音通讯学术会议论文集[C];2001年

9 王宏;潘金贵;;基于矩阵正态分布的文本有关说话人识别[A];2007通信理论与技术新发展——第十二届全国青年通信学术会议论文集(上册)[C];2007年

10 罗海风;龙长才;;多话者环境下说话人辨识听觉线索研究[A];中国声学学会2009年青年学术会议[CYCA’09]论文集[C];2009年

相关重要报纸文章 前1条

1 中科院自动化所生物特征认证与测评中心 白俊梅;听到的真实吗?[N];计算机世界;2003年

相关博士学位论文 前10条

1 单振宇;情感说话人识别及其解决方法的研究[D];浙江大学;2010年

2 姜涛;网络环境下说话人识别关键技术研究[D];哈尔滨工业大学;2011年

3 王琳琳;说话人识别中的时变鲁棒性问题研究[D];清华大学;2013年

4 王尔玉;基于若干声纹信息空间的说话人识别技术研究[D];中国科学技术大学;2012年

5 方远香;基于音素分类的短语音说话人识别[D];清华大学;2012年

6 蒋晔;基于短语音和信道变化的说话人识别研究[D];南京理工大学;2013年

7 黄挺;情感说话人识别中的基频失配及其补偿方法研究[D];浙江大学;2011年

8 李邵梅;文本无关短语音说话人识别技术研究[D];解放军信息工程大学;2011年

9 龚呈卉;基于联合因子分析的耳语音说话人识别研究[D];苏州大学;2014年

10 张冰;人类听觉信息处理机制的心理物理学研究[D];华中科技大学;2012年

相关硕士学位论文 前10条

1 张伟伟;说话人识别技术的研究[D];燕山大学;2010年

2 李伟娟;基于智能群体和盲源分离的说话人识别[D];兰州理工大学;2010年

3 王芳;说话人识别中一种特征参数的研究[D];安徽工业大学;2010年

4 傅庚申;说话人识别算法研究[D];大连理工大学;2005年

5 潘鹏;会议室环境下基于音频视频信息融合的多说话人识别[D];兰州理工大学;2011年

6 杨延龙;与文本无关的说话人识别的关键技术研究[D];西安电子科技大学;2010年

7 徐良军;基于语音信号时变特性的说话人识别[D];苏州大学;2010年

8 陈文翔;面向OPHONE手机的说话人识别技术移植研究[D];浙江大学;2011年

9 陈强;基于GMM的说话人识别系统研究与实现[D];武汉理工大学;2010年

10 黄肖忠;基于韵律特征的SVM说话人识别[D];中国科学技术大学;2010年



本文编号:1799716

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/wltx/1799716.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户a4510***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com